摘要: 术语介绍 信息检索(Information Retrieval):信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 非结构化数据:计算机不易处理的那种。 结构化数据:懂得都懂,DB。 聚类(clustering)是根据文档内容 阅读全文
posted @ 2023-01-13 00:53 memory_of_stars 阅读(363) 评论(0) 推荐(0)
摘要: 就在上周的这个时候,我确定了我的延毕,仔细想想真是气不打一处来,岛国是不是盛产偏执狂啊? 今年1月份回国的,学分还差一分必修,本来上学期就能修够这一学分了,但是又要忙在鹅厂的实习,又要忙秋招,实在是没有时间再去修一门课了,于是就把这一学分改到了这一学期修,这一学期只有两门必修课,一门我已经选过了,另 阅读全文
posted @ 2021-10-26 15:36 memory_of_stars 阅读(122) 评论(0) 推荐(0)
摘要: windows下配置golang开发环境和protoc 1.首先从golang官网下载并安装golang 2.环境变量中添加GOROOT和GOPATH,其中GOROOT是下载解压后的Go路径(例如C:/Users/lorianguo/Go/),GOPATH是项目所在的文件夹,可以自己定义着创建一个 阅读全文
posted @ 2021-04-14 11:54 memory_of_stars 阅读(414) 评论(0) 推荐(0)
摘要: goland得花钱又太笨重了,于是打算用vscode来写,本以为环境很容易就搭出来了,没想到花了一下午orz Golang是个新兴语言,更新换代太快了,于是许多网上的老教程都用不了,自己好不容易看了好多博客搭出来了,所以赶紧来记录下。 所需软件 1. VScode 2. Golang下载 下载Gol 阅读全文
posted @ 2021-03-28 12:44 memory_of_stars 阅读(1479) 评论(0) 推荐(0)
摘要: 先说下我本人的条件吧,科班出身,985本,东大硕,技能树点的很歪导致这次求职搞得我心力憔悴。 也幸运的是春招刚开始就能顺利到腾讯的HR面(希望最后别HR面给我挂了,那我真的心态爆炸)。 我大概是2020年年底就开始断断续续刷刷leetcode,打打周赛,不过比较咸鱼,最后也就刷了大概两百多道题吧,主 阅读全文
posted @ 2021-03-17 21:37 memory_of_stars 阅读(388) 评论(0) 推荐(0)
摘要: rename 可以使用 apt-get来安装 可以对文件进行批量重命名操作,对于一个data scientist那可是必不可缺的。 rename可以识别正则表达式,至于这里的正则表达式的规则,是和sed是一样的。 sed的常用编辑命令 p:打印匹配行 print d:删除指定行 delete a:在 阅读全文
posted @ 2020-08-19 16:12 memory_of_stars 阅读(644) 评论(0) 推荐(1)
摘要: ubuntu子系统误改了sudoers怎么办呢,也进不了recovery 暴力解决办法:从windows文件系统里修改 Ubuntu子系统路径: C:\Users\75100\AppData\Local\Packages\CanonicalGroupLimited.Ubuntu18.04onWind 阅读全文
posted @ 2020-04-07 10:38 memory_of_stars 阅读(322) 评论(0) 推荐(0)
摘要: 思考了一下,目前题目大概有了个眉目「基于GAN的蛋白质二级结构的生成及其应用」 具体的计划的话,我自己的想法是能够弄一个能根据人们的想法去生成具有特定性质的蛋白质二级结构序列,最好能为合成生物学这方面近一点微薄之力就是最好不过了,看了几个这方面的访谈,感觉还挺有意思的。 既然要按人们的要求去生成新的 阅读全文
posted @ 2019-11-14 16:35 memory_of_stars 阅读(653) 评论(0) 推荐(0)
摘要: WGAN(Wasserstein GAN) 1.传统GAN的问题 在上一篇学习GAN的博客中,我已经说了GAN所存在的问题,对于从data和artifacts中取样出的x来说,它们的分布很难有不可忽略的重叠部分,于是就会导致JS divergence一直取log2这个最大值,意思是Generator 阅读全文
posted @ 2019-10-30 19:03 memory_of_stars 阅读(338) 评论(0) 推荐(0)
摘要: 马上要修考出愿了 需要给导师再submit一份研究计划书, 根据之前导师的期望,硕士阶段的学习主要针对GAN在蛋白质设计方面的应用 所以在复习数学和专业课的百忙之中啊,必须再肝一份新的研究计划书出来, 首先从经典的GAN入手,再学习一下WGAN,然后就开始考虑自己在这方面的想法。 GAN GAN主要 阅读全文
posted @ 2019-10-29 18:35 memory_of_stars 阅读(401) 评论(0) 推荐(0)