合成数据生成技术研讨会深度解析

某中心协助举办合成数据生成研讨会

ICLR 2021研讨会汇集了研究合成数据生成的社群，旨在改进机器学习并保护隐私。

研讨会概述

我们很高兴宣布首届合成数据生成研讨会将于2021年5月7日在ICLR 2021线上举行。合成数据是解决两个不同问题的强大方案：数据限制和隐私风险。在标记数据有限的情况下，合成数据可用于增强训练数据，减轻过拟合。在保护隐私方面，数据管理者可以分享合成数据而非真实数据，既能保护用户隐私，又能保持原始数据的实用性。

尽管这两种场景共享相似的技术挑战（如质量和公平性），但它们通常被分开研究。我们的研讨会旨在加深对两种场景下合成数据生成挑战的理解。

组织团队

该研讨会由来自学术界和工业界的研究人员团队组织，他们在隐私、公平性、医疗保健和机器学习鲁棒性等主题方面拥有专业知识。团队包括来自某中心的两名科学家：某中心网络服务外部安全服务团队的应用科学家Sergul Aydore，以及某中心网络服务机器学习团队的首席应用科学家Krishnaram Kenthapadi；哈佛大学的Haipeng Chen；韩国科学技术院的Edward Choi；某机构DeepMind的Jamie Hayes；某信息安全中心的Mario Fritz；以及哥伦比亚大学的Rachel Cummings。

活动安排

我们的研讨会包括邀请演讲、投稿演讲、海报展示和小组讨论，汇集了多元化的研究人员和实践者。我们很荣幸地安排了以下七场邀请演讲（按出场顺序）：

《机器学习能否革新医疗保健？合成数据可能是答案》- 剑桥大学、艾伦图灵研究所、加州大学洛杉矶分校Mihaela van der Schaar
《图像合成的生成模型》- 某机构Jan Kautz
《使用生成对抗网络的差分隐私合成数据生成》- 某机构云AI团队Jinsung Yoon
《迈向金融合成数据》- 某金融机构、卡内基梅隆大学Manuela M. Veloso
《深度生成模型的偏见和泛化》- 斯坦福大学Stefano Ermon
《音乐生成的生成建模》- DeepMind Sander Dieleman
《生成式AI的伦理考量》- 某机构伦理AI团队Emily Denton

入选论文

研讨会收录了24篇论文，每篇论文都将有单独的分会场进行海报展示。其中以下七篇将进行口头报告：

《用于模型选择的合成数据》- Matan Fintz（某中心）等
《用于合成训练数据生成的GAN集成》- Gabriel Eilertsen等
《通过张量幻觉进行少样本学习》- Michalis M. L. Lazarou等
《利用公共数据进行实用私有查询发布》- Terrance Liu等
《快速、公平和私密的数据生成》- Weijie Xu（某中心）等
《通过医学图像生成克服数据共享障碍：全面评估》- August DuMont Schütte等
《不完美的图像生成：GAN加剧面部数据偏见的影响》- Niharika Jain等

研讨会将以邀请演讲者的小组讨论和颁奖典礼作为结束。

研究领域

机器学习
安全、隐私和滥用预防

会议信息

ICLR 2021

关于作者

Sergul Aydore是某中心网络服务的应用科学家。
Krishnaram Kenthapadi是某中心网络服务的首席科学家。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

公众号二维码

公众号二维码

posted @ 2025-10-07 22:20 CodeShare 阅读(18) 评论(0) 收藏举报

刷新页面返回顶部

codeshare1135