2020年9月21日

论文笔记 Futzing and Moseying: Interviews with Professional Data Analysts on Exploration Practices

摘要: 招募信的开头简介探索式数据分析 EDA is an approach to analyzing data, usually undertaken at the beginning of an analysis, to familiarize oneself with a dataset. Typic 阅读全文

posted @ 2020-09-21 11:26 likeatree 阅读(148) 评论(0) 推荐(0)

2020年6月25日

hanlp2.0代码块

摘要: import hanlp tokenizer = hanlp.load('PKU_NAME_MERGED_SIX_MONTHS_CONVSEG') tagger = hanlp.load(hanlp.pretrained.pos.CTB5_POS_RNN_FASTTEXT_ZH) syntactic 阅读全文

posted @ 2020-06-25 22:50 likeatree 阅读(846) 评论(0) 推荐(0)

2020年6月13日

Jupyter notebook 远程访问

摘要: ##generate config $ jupyter notebook --generate-config password $ jupyter notebook password Enter password: **** Verify password: **** [NotebookPasswo 阅读全文

posted @ 2020-06-13 16:13 likeatree 阅读(140) 评论(0) 推荐(0)

2020年6月4日

python -m spacy download en ConnectionError

摘要: 可能是国内不方便连接GitHub。 我早已配好了清华的anaconda源 (base) a@ubuntu:~$ cat .pip/pip.conf [global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple [install] trus 阅读全文

posted @ 2020-06-04 08:51 likeatree 阅读(1669) 评论(0) 推荐(1)

2020年5月27日

Ubuntu centos手动安装java

摘要: Java install /usr/lib/jvm/jdk1.8.0_161/ sudo mkdir -p /usr/lib/jvm/jdk-9.0.1 sudo mv jdk-9.0.1/* /usr/lib/jvm/jdk-9.0.1/ sudo update-alternatives --in 阅读全文

posted @ 2020-05-27 17:22 likeatree 阅读(172) 评论(0) 推荐(0)

修改whoosh支持hanlp中文分词

摘要: 先修改两个Python代码文件 在 anaconda3/lib/python3.7/site-packages/whoosh/analysis 下 analyzers.py加了一句话 from whoosh.analysis.tokenizers import ChineseTokenizer 然后 阅读全文

posted @ 2020-05-27 15:16 likeatree 阅读(290) 评论(0) 推荐(0)

2020年5月11日

‘Structured thinking’ & Morning Routine (medium summarization)

摘要: ‘Structured thinking’ is about building a big answer by asking many small questions https://forge.medium.com/learn structured thinking in 3 minutes Th 阅读全文

posted @ 2020-05-11 09:30 likeatree 阅读(255) 评论(0) 推荐(0)

2020年3月6日

20200306

摘要: ```bash iconv -c -f gb18030 -t UTF-8 nCov_10k_test.csv > a iconv -c -f GB2312 -t UTF-8 nCoV_900k_train.unlabled.csv > a && mv a nCoV_900k_train.unlabled.csv python extrac_wb.py nCov_10k_test.csv | tai 阅读全文

posted @ 2020-03-06 22:51 likeatree 阅读(136) 评论(0) 推荐(0)

2020年2月22日

HanLP pyhanlp 自定义分词词典

摘要: 词典格式: word\pos_tag\n pyhanlp安装和模型数据路径 使用pyhanlp,具体方法如下: pip install pyhanlp 安装pyhanlp 进入python安装包路径,如 /opt/anaconda3/lib/python3.7/site packages/pyhan 阅读全文

posted @ 2020-02-22 16:32 likeatree 阅读(1433) 评论(0) 推荐(0)

2019年3月29日

How to Use SSH Tunneling to Access Restricted Servers and Browse Securely

摘要: 搬运自 https://www.howtogeek.com/168145/how to use ssh tunneling/ For example, let’s say the database server at your office is located at 192.168.1.111 o 阅读全文

posted @ 2019-03-29 10:22 likeatree 阅读(210) 评论(0) 推荐(0)

导航