左手中倒影

hadoop技术控 大数据解决方案 hanlp研究爱好者
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 19 下一页

2018年9月30日

摘要: 最近在学习hanlp的内容,准备在节后看看有没有时间整理一波hanlp分享下,应该还是会像之前分享DKHadoop一样的方式吧。把整个学习的过程中截图在配文字的方式搞一下。 这两天也在看一些其他人分享的hanlp学习和使用分享的文章,后面看到的分享也会转载分享给大家。今天分享的这篇也是很早前别人分享的一篇如何用hanlp做分词的文章,新手入门级的可以看看! 阅读全文

posted @ 2018-09-30 10:25 左手中倒影 阅读(455) 评论(0) 推荐(0)

2018年9月29日

摘要: 一提到hadoop相信熟悉IT领域或者经常关注互联网新闻的朋友都应该很熟悉了,当然,这种熟悉可能也只是听着名字耳熟,但并不知道它具体是什么东西,或者用来做什么。这些都不重要,重要的是你知道有hadoop这么个东西就可以了。 前段时间码了一些hadoop方面的分享文章,纯属个人的一点小经验,可能有的地方写的不好,将就下吧!今天要分享的这篇是转载的一篇大快搜索公众号上的文章,是关于时下比较热闹的P2P金融方面对hadoop应用的一个架构设计。 阅读全文

posted @ 2018-09-29 11:51 左手中倒影 阅读(259) 评论(0) 推荐(0)

2018年9月28日

摘要: hanlp拥有:中文分词、命名实体识别、摘要关键字、依存句法分析、简繁拼音转换、智能推荐。 这里主要介绍一下hanlp的中文分词、命名实体识别、依存句法分析,这里就不介绍具体的hanlp的安装了,百度教程很多,可以看这里:http://hanlp.com/ 里面也有相关的一些介绍。 我以前还使用过j 阅读全文

posted @ 2018-09-28 09:53 左手中倒影 阅读(373) 评论(0) 推荐(0)

2018年9月26日

摘要: 以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在Github上,欢迎改进。 阅读全文

posted @ 2018-09-26 15:12 左手中倒影 阅读(324) 评论(0) 推荐(0)

2018年9月19日

摘要: Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。Hanlp具备功能完善、性能高效、架构清洗、语料时新、可自定义的特点;提供词法分析(中文分词、磁性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。 本篇将用户输入的语句根据词库进行分词、关键词提取、摘要提取、词库维护。 阅读全文

posted @ 2018-09-19 11:05 左手中倒影 阅读(162) 评论(0) 推荐(0)

2018年9月11日

摘要: Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。Hadoop的发行版除了有Apache hadoop外cloudera,hortonworks,mapR,华为,DKhadoop等都提供了自己的商业版本。商业发行版主要是提供了更为专业的技术支持,这对于大型企业更为重要,不同发行版都有自己的一些特点,本文就各发行版做简单对比介绍。 阅读全文

posted @ 2018-09-11 10:31 左手中倒影 阅读(821) 评论(0) 推荐(0)

摘要: 翻了一下最近一段时间写的分享,DKHadoop发行版本下载、安装、运行环境部署等相关内容几乎都已经写了一遍了。虽然有的地方可能写的不是很详细,个人理解水平有限还请见谅吧!我记得在写DKHadoop运行环境部署的时候,遗漏了hadoop服务角色的内容,本篇特地补上这部分内容吧,不然总觉得不舒服。 阅读全文

posted @ 2018-09-11 08:47 左手中倒影 阅读(371) 评论(0) 推荐(0)

2018年9月8日

摘要: “学习hadoop需要什么基础”这已经不是一个新鲜的话题了,随便上网搜索一下就能找出成百上千篇的文章在讲学习hadoop需要掌握的基础。再直接的一点的问题就是——学Hadoop难吗?用一句特别让人无语的话回答就是:难不会,会不难! 趁着学校放假的时间,写了一些hadoop学习分享的文章。刚开始写的几 阅读全文

posted @ 2018-09-08 10:20 左手中倒影 阅读(222) 评论(0) 推荐(0)

2018年9月5日

摘要: 今天准备分享一下Apache Shiro 在web开发中的应用。shiro安全框架是目前为止作为登录注册最常用的框架,因为它十分的强大简单,提供了认证、授权、加密和会话管理等功能 。 阅读全文

posted @ 2018-09-05 10:30 左手中倒影 阅读(228) 评论(0) 推荐(0)

2018年9月3日

摘要: 数据中心内部系统的核心要求是“稳定可靠”,一是指系统在运行过程中有能力提供连续可靠的服务,长时间无故障运行;二是指当故障发生之后,有能力快速定位,及时排查,故障范围不蔓延。 分离式部署的方式,使得系统与云平台系统相独立,避免了计算和存储争抢CPU/内存/网络等物理资源,一旦某一方资源需求骤升导致的另 阅读全文

posted @ 2018-09-03 16:14 左手中倒影 阅读(1067) 评论(0) 推荐(0)

上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 19 下一页