刷新
读数据科学伦理:概念、技术和警世故事09伦理建模

博主头像 1. 伦理建模 1.1. 女性的隐形歧视问题 1.2. 可解释性问题,即能够解释预测结果 1.2.1. 之所以需要能够解释预测结果,是因为我们既要获得对模型的信任,又要有所感悟,还要改进模型 1.3. 可解释性方法 1.3.1. 复杂模型可解释性方法(LIME) 1.3.2. 反事实分析方法 1.3 ...

读数据科学伦理:概念、技术和警世故事07再识别和公平

博主头像 1. 再识别 1.1. 我们生活在数字化时代,行为数据记录着我们的一举一动的 1.1.1. 行为数据会带来隐私风险,主要因为有完全相同记录行为的人数极少,所以才可以进行再识别 1.1.2. 加强k-匿名会大大降低此类数据的效用,因为此类数据具有细粒度属性,因此建立在此类数据上的预测模型的精确度往往会 ...

读数据科学伦理:概念、技术和警世故事06伦理数据预处理

博主头像 1. 伦理数据预处理 1.1. 仅仅通过去身份化措施是远远不够的 1.2. 仅仅去除信息的敏感属性并不足以消除对敏感群体(如外国学生)的偏见 1.3. 找到方法消除数据集中存在的偏见并利用生成的预测模型来避免歧视现象的出现 1.4. 对数据集采用k-匿名、l-多样性或t-贴近度法等手段以加强隐私保护 ...

升级遇到坑?一文带你搞定 DolphinScheduler 2.0 到 3.0 升级

博主头像 1.升级背景 因项目需要使用数据质量模块功能,可以为数仓提供良好的数据质量监控功能。故要对已有2.0版本升级到3.0版本以上,此次选择测试了3.0.1 和 3.1.1 两个版本,对进行同数据等任务调度暂停等操作测试,最后选择3.0.1 版本 原因: 3.1.1 在测试sql任务时 ,同时启动上百sq ...

读数据科学伦理:概念、技术和警世故事04隐私保护机制

博主头像 1. 加密 1.1. 在数据保护的基本方法中,加密可能是最重要的一种方法 1.1.1. 加密的基本概念是指将信息进行编码,只有经过授权的人才可访问它 1.1.2. 在现代社会,这是保障个人数据安全储存和传输的重要工具 1.1.3. 信息编码被称为密码 1.1.4. 在加密中,密文仍能被还原成明文 1 ...

Apache DolphinScheduler社区答疑Star第三期评选结果公示

博主头像 Apache DolphinScheduler社区答疑Star第三期评选活动圆满完成啦!本次活动旨在表彰那些长期为社区用户提供专业解答、积极推动技术交流的社群管理员。经过社区成员的公开票选,和上期一样,在25个社区群中共有2位表现突出的管理员获得最多投票。让我们热烈祝贺以下获奖者(按排名顺序): � ...

Agentic AI要终结数据库和SaaS?大厂掌门人公开互撕,焦虑的CEO们押上了不同的技术路线

博主头像 作者 | Tina Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。 无论是大模型厂商、AI 初创公司,还是企业级应用团队,几乎都在讨论“多智能体协作”“自动化决策流程”以及“具备工具调用能力的 AI 系统”。 谷歌、英伟达等科技巨头纷纷布局,上个月亚马逊还成立了一个专注于 A ...

读数据科学伦理:概念、技术和警世故事03伦理数据的收集

博主头像 1. 伦理数据的收集 1.1. 隐私保护技术,如加密、模糊处理和差分隐私,这些技术着眼于保持隐私与个人数据的收集和存储之间的平衡 1.2. 有偏差的数据科学模型通常是由所收集的数据的偏差造成的 1.3. 重视伦理的数据收集实践是人体实验 1.4. 所有的数据科学项目都离不开数据 1.4.1. 就隐私 ...

读数据科学伦理:概念、技术和警世故事02FAT流程框架

博主头像 1. 概述 1.1. 任何一种框架或核查表都会很快过时(因此需要定期更新)​:数据源、技术、应用程序和伦理考量都在不断地变化 1.2. 将FAT流程框架作为通用的指导准则 2. 三个属性 2.1. 公平、责任和透明(FAT) 2.1.1. 前两个准则用于评定伦理概念,比如隐私、歧视和可解释性 2.1 ...

读数据科学伦理:概念、技术和警世故事01数据科学伦理导读

博主头像 1. 数据科学伦理的兴起 1.1. 数据科学实践包括:获取数据、​(预)处理数据、分析数据、对数据进行建模、评估结果,然后使用模型或结果学习知识、支持论点或做决策 1.2. 数据科学家 1.2.1. 被誉为21世纪最具吸引力的职业 1.2.2. 不仅要在现有数据集上调用预先定义库,还要在数据科学项目 ...

<1···567···13>