关于黄海广博士所创 “机器学习爱好者” 项目及其网站的详细说明

此前一直站在幕后,而一些事情所有的来龙去脉只有我最清楚,因为我和黄海广博士、网易云课堂、吴恩达教授以及 Coursera GTC 翻译平台、deeplearning.ai 官方都有过交流,所以我还是得留下点东西作为说明,省得大家在网络上天天吵吵闹闹啊都没有静下心来认真学习。本文所提及的内容,我都留有聊天记录佐证,部分授权信息保留有电子邮件记录,考虑到隐私权不在此全部公开。所以如果有人提出质疑,可以向我发邮件索要更多的信息。如果依旧有人在网络上发布一些与此相关,但毫无营养只为博人眼球的内容,我会把资料交给受到影响的一方,让他们有证据进行维权。

按照时间轴还原事件过程

吴恩达教授的《机器学习》课程在 Coursera 上线,后来官网更新的中文字幕无法让人满意。果壳网网友 “小小V_” 自发地对部分的视频进行了翻译,一段时间后黄海广博士与其在中海大实验室的师兄弟们一起对其它的视频进行了字幕翻译,并且结合 “小小V_” 的字幕压制成了 mkv 格式,发布在了网络平台以便于其他人获取字幕与视频文件。由于人气不断积累,黄海广博士至今已经拥有了 5 个 “机器学习爱好者” 的两千人交流群。我于17年7月入群,此时视频只能通过百度网盘获取,由于 Bilibili 网络平台的兴起及其免费性,我询问了黄海广博士是否能够将视频上传到 B 站方便大家观看,也就是现在 B 站依旧保留的《机器学习》视频项目,他个人表示不用授权,截图如下:

至于同期制作的《机器学习个人笔记》项目,看过视频的应该知道,其实就是通过原始中文字幕和视频截图,对视频内容进行了整合,目的是方便大家观看。

不到一个月后,《深度学习》专项课程在 Coursera 上线,如果不进行付费,则只能够获取到视频内容,编程作业无法解锁。但视频依旧没有中文字幕,所以在 QQ 群内,我询问黄博是否能组织群友对《深度学习》字幕进行翻译。黄博表示之前参与《机器学习》翻译的 QQ 群还在,但是大都没时间了,所以后续整个翻译志愿者的招募和任务安排、质量把控都是我在管理,黄博负责在 QQ 大群更新动态,以及把 srt 字幕和 mp4 视频封装到 mkv 格式的视频文件中去:

一段时间后,B 站上传的视频在知乎被爆出侵权。黄海广博士在群里发言表示 B 站的视频不是他上传的,与他毫无关联(这种态度挺让我恼的,不过的确将视频上传 B 站是我的主张,而大群里没人知道是我在管理翻译团队),并且表示大家继续通过百度云下载更新的视频即可。与此同时,志愿者翻译组进度停止,我一个人遭受巨大舆论压力,开始各方寻找合法办法解决。首先是第一时间找到了 Coursera 的相关项目,加入他们的志愿者微信群,给出了一个临时的合作翻译方案:https://github.com/Yukong/Deeplearning.ai-Solutions . 不过 Coursera 使用的在线翻译工具经常出问题,被志愿者们吐槽不好用。后来网易的人员找到我,表示《深度学习》课程的国内版权已经被他们获得,看怎么处理比较合适。我想,有方法解决了,这可太好了!


当时依靠黄海广博士号召组织起的志愿者们,通过我公布的 QQ 在线文档把控整体进度,《深度学习》课程刚在 Coursera 上线的时候只有前三课,而网易作为中国代理已经拿到了全部的五门课的内容,而且已经内部悄悄地翻译完了。而当时群里面志愿者制作的字幕只完成了前三课,直接让网易上线就 OK 了。所以请注意,现在网易的《深度学习工程师》的字幕完全是他们在之前就独立翻译好的,并没有参考或者抄袭 QQ 群字幕组的字幕文件这一说法。

这件事情结束后,大家都很开心,黄博士开始在群里组织人制作《深度学习学习笔记》,从这开始我就再没有参与他们的项目了。不过笔记内容和《机器学习个人笔记》类似,视频截图加字幕摘录。

网易在获得《深度学习》版权的同时也获得了旧的《机器学习》视频版权,因此这个课程后面也需要上线,考虑到黄博士已经有翻译了,所以我们询问了他是否可以提供原始的英文字幕。

《机器学习》一共 113 个视频,而黄博士等人负责的是其中 20 个,所以这样的说明需要被重视,否则盗用别人的作品是需要负法律责任的。由于原始的机器学习字幕很糟糕(B站版本),而网易比较在乎质量,所以又重新付费让一批人进行翻译改进,也就是现在在网易云课堂能够搜索到的 “吴恩达机器学习” 视频。具体两个版本差异有多大,大家可以自己去对比。到此也就没有什么后续的事情了,只是总有些 “杠精” 喜欢惹事生非。我保留 B 站版本的视频,也是为了字幕改善前后的进行对比。

针对一些问题回答

首先总结一下黄海广博士的贡献:创立机器学习爱好者群,给大家提供了一个良好的平台。另外 B 站的《机器学习》视频字幕来自于他的封装(六分之一左右的字幕是其实验室人员制作的,不过根据视频开头的信息可以发现 “小小V_” 等人的字幕也被他用个人信息署名了,博士当时应该没想到会有这么大影响力,所以后续也进行了说明),以及对作品进行了宣传,再多的贡献也是过誉了。根据黄海广博士提供的中海大翻译人员名单可知,他们每个人的平均翻译量只在一至二个视频,而最终却在每个视频的字幕开头都进行了个人性质的署名,再多的话也不用说得太挖苦了。再总结一下网易的贡献:网易云课堂引进了这两门课,让一切变得合理合法化,而且深度学习字幕是完全自制的,机器学习字幕也是花了更多时间去重制。不然很多人现在还需要访问 Coursera 服务器观看视频,实际上网络连接也经常受到了一定的阻碍。

曾经有段时间黄海广博士的群里面有一些异样的声音,说网易字幕抄他的成果,可他本人没有回应或者说澄清。我想他自己内心也是心虚的,我只记得那段时间群友们都是送给他鲜花与掌声,而侵权事件发生的时候他没有站出来,还在宣传自己的百度网盘,这些事他都无法否认。现在他也算功成身就了(网站浏览量 + Github / 知乎关注),但是如果又有脑残粉发表不当言论,无脑乱黑网易 / Couresa 甚至是吴恩达教授本人,而他本人不加以制止,我想他也需要承担一定的责任。所以一个人是有好也有坏的,需要理性看待发生的事情,不能无脑吹捧,也不能无脑抹黑。

我不清楚所谓的笔记应该如何定义,两份学习笔记的 PDF 只能算是演绎作品,更不用说考虑将其出版了... 有的人喜欢看书,有的人喜欢看视频,黄海广博士提供给了我们更多的选择值得感谢,请他人不要用于商业用途。我个人更认同的笔记形式应当是红色石头 这种,提炼重点和概要,又没有侵权的嫌疑。从法律上讲,如果还有人提供这两门课的视频下载,也是侵权的,吴恩达教授已经让网易帮忙打击《深度学习》视频在国内的盗版现象啦。(请也尊重一下网易的劳动吧)

posted @ 2018-07-23 13:05 AcceptedDoge 阅读(...) 评论(...) 编辑 收藏