2020年12月23日
摘要:
好的算法 DSA(data structure+althogrim)*effective 成本:运行时间+所需存储空间 问题实例的规模,往往决定了计算成本 图灵机 RAM(Random Access Machine) 大O记号(big-O notation) 应该说是用来简化空间复杂度和时间复杂度的
阅读全文
posted @ 2020-12-23 18:18
晕晕小缸
阅读(68)
推荐(0)
2020年6月22日
摘要:
一、NLP的研究任务 机器翻译; 情感分析; 智能问答; 文摘生成; 文本分类:采集各种文章,进行主题分析,从而进行自动分类; 舆论分析; 知识图谱:知识点相互连接而成的语义网络。 二、基本术语 分词; 词性标注:对动词、名词、形容词等进行词性标注。eg:我/r 爱/v 北京/ns 天安门/ns;
阅读全文
posted @ 2020-06-22 23:56
晕晕小缸
阅读(238)
推荐(0)
2020年5月14日
摘要:
背景 文本分类属于文本挖掘。文本挖掘从已知文本提取未知的知识,即从非结构的文本中提取知识。文本挖掘主要领域:搜索和信息检索;文本聚类;文本分类;Web挖掘;信息抽取;自然语言处理;概念提取。[1] 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和关键字搜索。 文本聚类:使用聚类方法,对词汇,片段
阅读全文
posted @ 2020-05-14 23:13
晕晕小缸
阅读(994)
推荐(0)
2020年4月19日
摘要:
多进程和多线程 多线程可以实现代码并行,提高运行效率。Python 采用 threading 和 Queue 模块实现多线程编程。 线程和进程区分 进程 重量级进程,是程序的一次执行。每个进程有自己的内存空间、数据栈,仅能使用进程间通讯(IPC),而不能直接共享信息。 进程池的大小是每次同时执行的进
阅读全文
posted @ 2020-04-19 15:59
晕晕小缸
阅读(889)
推荐(0)