代码改变世界

阅读排行榜

Clean Text

2021-05-20 13:31 by DataBases, 34 阅读, 收藏,
摘要: import reimport stringdef clean_text(s): """ This function cleans the text a bit :param s: string :return: cleaned string """ # split by all whitespac 阅读全文

Elasticsearch基础使用

2022-06-01 11:48 by DataBases, 26 阅读, 收藏,
摘要: https://www.jianshu.com/p/d48c32423789 Elasticsearch是一个开源的分布式、RESTful 风格的搜索和数据分析引擎,它的底层是开源库Apache Lucene。 一个分布式的实时文档存储,每个字段可以被索引与搜索;一个分布式实时分析搜索引擎;能胜任上 阅读全文

How to sort directories (folders) by size in Linux

2021-09-22 18:10 by DataBases, 26 阅读, 收藏,
摘要: du --si --max-depth=1 /home/ | sort -n -r |more Breakdown:du = show disk usage-si = in human readable (aka "nice") numbers--max-depth=1 only show this 阅读全文

开发工具

2022-06-17 14:59 by DataBases, 25 阅读, 收藏,
摘要: https://c.runoob.com/ http://dblab.xmu.edu.cn/post/spark/ http://dblab.xmu.edu.cn/blog/spark/ https://mirror.bjtu.edu.cn/ https://github.com/jc-dian/p 阅读全文

Apache项目maven 仓库对应版本的jar包下载地址

2022-12-21 10:46 by DataBases, 22 阅读, 收藏,
摘要: https://repo.maven.apache.org/maven2/org/apache/hudi/ 阅读全文