2012年8月15日

信息检索导论学习笔记(4)

摘要: 索引构建 回顾倒排索引的构建,首先,我们扫描一遍文档集合得到所有的词项—文档 ID 对。然后,我们以词项为主键、文档 ID 为次键进行排序。最后,将每个词项的文档 ID组织成倒排记录表, 并计算诸如词项频率或者文档频率的统计量。对于小规模文档集来说,上述过程均可在内存中完成。对于大规模文档集,由于内存不足,我们必须使用基于磁盘的外部排序算法(external sorting algorithm... 阅读全文

posted @ 2012-08-15 16:30 God bless you 阅读(4101) 评论(0) 推荐(1) 编辑

2012年8月13日

信息检索导论学习笔记(3)

摘要: 词典及容错式检索 如上图,倒排索引记录表构建好后。对于查询请求“solr”,我们的首要任务是确定查询词项solr是否在词典的词项词汇表中,如果在,则返回该词项对应的倒排记录表的指针。如何在数据结构(即词典)中快速定位词项? 词典(即存储词项词汇表的数据结构) 快速定位词项主要有两大类解决方案 哈希表方式 每个词项通过哈希函数映射成一个整数,映射函数的目标空间需要足够大,以减少哈希结果... 阅读全文

posted @ 2012-08-13 12:48 God bless you 阅读(4089) 评论(3) 推荐(0) 编辑

2012年8月10日

信息检索导论学习笔记(2)

摘要: 词项词典及倒排记录表回顾倒排索引的构建收集待建索引的原文档(Document)将原文档传给词条化工具(Tokenizer)进行文本词条化将第二步得到的词条(Token)传给语言分析工具(Linguistic modules)进行语言学预处理,得到词项(Term)将得到的词项(Term)传给索引组件(Indexer),建立倒排索引文档文档分析以及编码转换语言识别、编码方式识别、文件格式等处理,得到字符序列。如何确定索引的单位? 合理组织“索引粒度”,确定文档单位注:语言识别和编码识别,理论上都可以看成是分类问题,基于分类方法进行处理。但实际中,常采用启发式方法词条化定义好文档单位之后,词条化是将 阅读全文

posted @ 2012-08-10 15:46 God bless you 阅读(4605) 评论(0) 推荐(0) 编辑

信息检索导论学习笔记(1)

摘要: 布尔检索 信息检索概述 信息检索:是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 Information Retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies ... 阅读全文

posted @ 2012-08-10 15:35 God bless you 阅读(3755) 评论(1) 推荐(3) 编辑

2012年7月30日

转 1993年两个人开发了最初的Adobe Flash—他们现在在干吗?

摘要: 1993年两个人开发了最初的Adobe Flash—他们现在在干吗?随着Adobe公司上月宣布不再提供flash对Andriod 4.1的支持,事实已经很明白:Flash正走向死亡。当然,这需要时间,在未来的数年里,Flash仍然会在互联网上占有一席之地,但是,如果你承认Falsh在手机移动市场上确实是失败了,那么,现在正是你开始为Flash准备后事的时候了。对Flash来说这真是不幸,它曾经有过如此的辉煌。Flash曾给互联网带来了一次次的变革,启发了整整一代的程序员和设计师不断的扩展web的疆域。Flash走向终结的消息引发我们思考。Flash的创造者们现在在干吗呢?他们是否依然在埋头编码 阅读全文

posted @ 2012-07-30 09:47 God bless you 阅读(751) 评论(2) 推荐(0) 编辑

2012年5月4日

Flex移动开发第一步(Flex Mobile View and ViewNavigator组件学习笔记)

摘要: 历史背景 在传统的Flex AIR桌面应用程序开发中,我们有足够的屏幕分辨率以及系统资源来在屏幕下填充足够的信息已满足我们的开发需求。通过采用分层菜单和弹出窗口,我们可以在屏幕上堆砌足够多的信息。与此相比,智能手机的屏幕感觉像stamp。由于分辨率以及不同设备DPI的影响,Flex mobile开发通常采用Screen Split技术,将页面切分成很多部分来展示。Flex mobile SDK通过View和ViewNavigator提供了这一默认实现。Mobile SDK实现 View和ViewNavigator是这个Flex mobile SDK中的新概念,它通过内建机制实现Screen S 阅读全文

posted @ 2012-05-04 14:18 God bless you 阅读(5578) 评论(0) 推荐(1) 编辑

2011年7月29日

Flex StringUtil工具类

摘要: 最近发现Flex处理字符串的工具类一共有三个,分别是:mx.utils包下的StringUtilmx.utils包下的RPCStringUtilas3corelib类库下的StringUtil下面分别整理及介绍下这三个工具类的用法:mx.utils包下的StringUtil1.trim()2.isWhitespace() 判断是否是空白字符3.trimArrayElements()删除数组中每个元素的开头和末尾的所有空格字符,此处数组作为字符串存储。4.substitute()使用传入的各个参数替换指定的字符串内的“{n}”标记。示例:var str:String = "here i 阅读全文

posted @ 2011-07-29 16:06 God bless you 阅读(3086) 评论(0) 推荐(0) 编辑

Flex AIR程序日志工具类LogUtil

摘要: Flex默认集成了一个功能齐全的Logging框架,它位于mx.logging包下。as3corelib类库中的类com.adobe.air.logging.FileTarget对Flex logging进行了一定的封装,可以在AIR程序中自由设置日志文件的存储路径以及添加了个清除所有日志的功能。由于实际项目的需求,在FileTarget类的基础上,我进行了再封装。新封装的LogUtils工具类不仅可以控制日志输出的目的地,还可以控制日至输出级别,便于调试和发布。鉴于对工具类使用的讲解,简要说明下官方Logging框架。详细信息请参阅官方文档:http://livedocs.adobe.com 阅读全文

posted @ 2011-07-29 11:41 God bless you 阅读(2028) 评论(0) 推荐(0) 编辑

2011年7月14日

Flex builder3自动识别TODO/FIXME标记

摘要: 自己编码时经常喜欢用TODO标记在代码中还未处理的任务。可是,Flex builder3不会自动在Task View中列出TODO/FIXME等标记,每次要查询未完成的任务时,都得全文搜索TODO,很不方便!! 解决办法:Flex Builder Task 插件 下载插件 解压后复制de.richinternet.flexbuilder.task_1.0.0.jar到Flex builder3 ... 阅读全文

posted @ 2011-07-14 12:49 God bless you 阅读(418) 评论(0) 推荐(0) 编辑

2011年7月12日

在线文档制图

摘要: 网址:http://www.diagram.ly/ 阅读全文

posted @ 2011-07-12 13:10 God bless you 阅读(162) 评论(0) 推荐(0) 编辑

导航