合成数据生成技术研讨会深度解析

某中心协助举办合成数据生成研讨会

ICLR 2021研讨会汇集了研究合成数据生成的社群,旨在改进机器学习并保护隐私。

研讨会概述

我们很高兴宣布首届合成数据生成研讨会将于2021年5月7日在ICLR 2021线上举行。合成数据是解决两个不同问题的强大方案:数据限制和隐私风险。在标记数据有限的情况下,合成数据可用于增强训练数据,减轻过拟合。在保护隐私方面,数据管理者可以分享合成数据而非真实数据,既能保护用户隐私,又能保持原始数据的实用性。

尽管这两种场景共享相似的技术挑战(如质量和公平性),但它们通常被分开研究。我们的研讨会旨在加深对两种场景下合成数据生成挑战的理解。

组织团队

该研讨会由来自学术界和工业界的研究人员团队组织,他们在隐私、公平性、医疗保健和机器学习鲁棒性等主题方面拥有专业知识。团队包括来自某中心的两名科学家:某中心网络服务外部安全服务团队的应用科学家Sergul Aydore,以及某中心网络服务机器学习团队的首席应用科学家Krishnaram Kenthapadi;哈佛大学的Haipeng Chen;韩国科学技术院的Edward Choi;某机构DeepMind的Jamie Hayes;某信息安全中心的Mario Fritz;以及哥伦比亚大学的Rachel Cummings。

活动安排

我们的研讨会包括邀请演讲、投稿演讲、海报展示和小组讨论,汇集了多元化的研究人员和实践者。我们很荣幸地安排了以下七场邀请演讲(按出场顺序):

  • 《机器学习能否革新医疗保健?合成数据可能是答案》- 剑桥大学、艾伦图灵研究所、加州大学洛杉矶分校Mihaela van der Schaar
  • 《图像合成的生成模型》- 某机构Jan Kautz
  • 《使用生成对抗网络的差分隐私合成数据生成》- 某机构云AI团队Jinsung Yoon
  • 《迈向金融合成数据》- 某金融机构、卡内基梅隆大学Manuela M. Veloso
  • 《深度生成模型的偏见和泛化》- 斯坦福大学Stefano Ermon
  • 《音乐生成的生成建模》- DeepMind Sander Dieleman
  • 《生成式AI的伦理考量》- 某机构伦理AI团队Emily Denton

入选论文

研讨会收录了24篇论文,每篇论文都将有单独的分会场进行海报展示。其中以下七篇将进行口头报告:

  • 《用于模型选择的合成数据》- Matan Fintz(某中心)等
  • 《用于合成训练数据生成的GAN集成》- Gabriel Eilertsen等
  • 《通过张量幻觉进行少样本学习》- Michalis M. L. Lazarou等
  • 《利用公共数据进行实用私有查询发布》- Terrance Liu等
  • 《快速、公平和私密的数据生成》- Weijie Xu(某中心)等
  • 《通过医学图像生成克服数据共享障碍:全面评估》- August DuMont Schütte等
  • 《不完美的图像生成:GAN加剧面部数据偏见的影响》- Niharika Jain等

研讨会将以邀请演讲者的小组讨论和颁奖典礼作为结束。

研究领域

  • 机器学习
  • 安全、隐私和滥用预防

标签

  • 合成数据生成
  • ICLR
  • 差分隐私

会议信息

ICLR 2021

关于作者

Sergul Aydore是某中心网络服务的应用科学家。
Krishnaram Kenthapadi是某中心网络服务的首席科学家。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

posted @ 2025-10-07 22:20  CodeShare  阅读(18)  评论(0)    收藏  举报