导航

03 2011 档案

摘要:http://www.matrix67.com/blog/archives/4212漫话中文分词算法 记得第一次了解中文分词算法是在Google 黑板报上看到的,当初看到那个算法时我彻底被震撼住了,想不到一个看似不可能完成的任务竟然有如此神奇巧妙的算法。最近在詹卫东老师的《中文信息处理导论》课上再次学到中文分词算法,才知道这并不是中文分词算法研究的全部,前前后后还有很多故事可讲。在没有建立统计语言模型时,人们还在语言学的角度对自动分词进行研究,期间诞生了很多有意思的理论。中文分词的主要困难在于分词歧义。“结婚的和尚未结婚的”,应该分成“结婚/的/和/尚未/结婚/的”,还是“结婚/的/和尚/未/ 阅读全文

posted @ 2011-03-21 09:42 maconel 阅读(478) 评论(0) 推荐(0)

摘要:这里说的ffmpeg,是指ffmpeg命令行程序,而不是用ffmpeg的库来编程。操作系统是ubuntu10.04,ffmpeg的版本是FFmpeg version git-N-28517-g19d82cb, Copyright (c) 2000-2011 the FFmpeg developers。手机上主要是将分辨率降低,将编码格式转为h264或mpeg4(很多手机上有硬解码,比如我用的m8)。目前源文件只能是mp4或avi,后续再尝试rmvb。一.安装ubuntu10.04下安装看这里http://ubuntuforums.org/showpost.php?p=9868359&p 阅读全文

posted @ 2011-03-19 22:30 maconel 阅读(3042) 评论(0) 推荐(0)

摘要:批处理的偏门小技巧在批处理应用中,我们经常为两方面的东西发愁:路径和文件名、日期和时间,在自动化构建也碰到这样的问题,经过查找资料和验证,把获取这些参数数据的方法罗列如下:表达式功能描述%1 ~ %9脚本参数,%0 --脚本文件,%1 ~ %9第一个至第九个参数%CD%获取当前脚本所在的目录%~dp0获取当前脚本所在的目录%~f0获取当前脚本的完整路径%~n0获取当前脚本的文件名(不含扩展名)%~nx0获取当前脚本的文件名(包括扩展名)%~x0获取当前脚本的扩展名%DATE%获取当前日期:2010-10-27星期三【注:可能被用户修改】%TIME%获取当前时间:18:19:29.78【注:可能 阅读全文

posted @ 2011-03-11 09:58 maconel 阅读(302) 评论(0) 推荐(0)

摘要:转自:http://www.microsoft.com/resources/documentation/windows/xp/all/proddocs/en-us/percent.mspx?mfr=trueUsing batch parametersYou can use batch parameters anywhere within a batch file to extract information about your environment settings.Cmd.exe provides the batch parameter expansion variables %0 th 阅读全文

posted @ 2011-03-11 09:52 maconel 阅读(315) 评论(0) 推荐(0)

摘要:最进学到了adb工具的一些小技巧,记录在此。操作系统是windows用。# 非阻塞logcat使用-d参数,可以在读完所有log后返回,而不会一直等待,在自动化较有用。例如:adb logcat -d -s xxx > xxx.log //得到filter为xxx的日志,存入xxx.log,然后返回。# 用grep过滤logwindows也不要紧,grep有windows版本。其实,装了cygwin后,它就带了grep。adb logcat | grep xxx //过滤出带xxx字样的log# 在本地执行adb shell中的命令我们常需要adb shell后,在设备上执行一些命令。其 阅读全文

posted @ 2011-03-10 18:32 maconel 阅读(4874) 评论(0) 推荐(0)