围观腾讯云输入法如何回发用户输入

  太久没有写博客了,这个懒惰的惯性实在是太强大。这两天不说说360和QQ的事情,就显得很out了,但是说来说去却又很鸡毛。另外我怎么没有看到什么弹窗呢,听说好不热闹啊,TM/MSN和MSE用户艰难的表示鸭梨很大。腾讯云输入法回传用户输入数据,在这个节骨眼上被逮到,还真算给力。

 

  大家可以去“腾讯软件中心”试试这个云输入法,http://py.qq.com/web/。但是注意不要输入什么敏感内容,免的有被跨省的风险。百度也有类似的输入法,只是好像没有咋呼叫作云输入法,而且百度还支持手写。谁有兴趣,可以查一下哪家先出的这种输入法?

 

  说正经的,QQ云输入法是怎么工作的呢?很简单,给任意一个网页导入一个脚本文件就可以了。 

<script type="text/javascript" language="JavaScript" src="http://ime.qq.com/fcgi-bin/getjs"></script>

   相当简单。然后呢,取回一个大约42k的文件,叫ime.js。文件是压缩过的,版本号:rev.632(这个很重要,待会儿他们一加班,就拿不到了)

 

  脚本启动后,会后先向服务器报告一下客户端环境,这些从浏览器里获取的参数,不是什么隐私,就是user-agent都比这丰富。

http://ime.qq.com/fcgi-bin/reportfirst?key=d02e5d08310c90ac54d37089fbf3d8ed&version=632&sp=1&sw=1920&sh=1080&dw=1920&dh=512&t=1289458673612

   但是惊喜还是有的,这个报告中包含了一个唯一的key,作用就相当于浏览器session_id。接下来的所有和腾讯服务器的交互,都会带着这个key。

 

  在英文输入状态下,任何字符输入会被云输入法脚本截获,然后向服务器回发如下请求:

http://ime.qq.com/fcgi-bin/getword?key=d02e5d08310c90ac54d37089fbf3d8ed&cb=window.QQWebIME.callback612&q=qq

   注意key!cb是ime.js运行后注册的回调函数,蓝色的qq是我的输入。服务器响因为:

window.QQWebIME.callback612({"is_end":"0","p":"1","pg":"5","q":"qq","ret":"suc","rs":["QQ","亲戚","亲亲","悄悄","轻轻","强求","求求","缺钱","请求","亲切","圈圈","前期","瞧瞧","亲情","全球","气球","齐全","取钱","情趣","千千"],"rscnt":"20","rsn":["2","2","2","2","2","2","2","2","2","2","2","2","2","2","2","2","2","2","2","2"]})

   这时你可以像普通输入法一样进行选词,而且很自然的是,选词后没有服务器请求发生。也就是你的输入内容,都是在浏览器本地完成的,腾讯除了知道你请求了什么候选词列表外,不知道你到底输入了什么。似乎这一切都很美好,也就应该是这么美好才对,是吧?

 

  但是这不是360在隐私问题上掐QQ吗,本来我一直认为腾讯这么大一个上市公司,做事还是该有点底线的。但是360让大家看到了腾讯是没有底线的,真流氓揭露了伪君子。于是我就怀着最大的恶意想,这输入法因该还是有问题的。于是继续使用,突然发现一个异常的服务器请求,如下: 

http://ime.qq.com/fcgi-bin/reportword?key=d02e5d08310c90ac54d37089fbf3d8ed&num=11&xl=danshi,%E4%BD%86%E6%98%AF,0,0,1,0|zhe,%E8%BF%99,0,0,1,0|bushi,%E4%B8%8D%E6%98%AF,0,0,1,0|zaihe,%E5%9C%A8%E5%92%8C,0,0,1,0|tengxun,%E8%85%BE%E8%AE%AF,0,0,1,0|zuoweiyige,%E4%BD%9C%E4%B8%BA%E4%B8%80%E4%B8%AA,0,0,1,0|shangshi,%E4%B8%8A%E5%B8%82,0,0,1,0|gongsi,%E5%85%AC%E5%8F%B8,0,0,1,0|zuoshihaishiyinggai,%E5%81%9A%E4%BA%8B%E8%BF%98%E6%98%AF%E5%BA%94%E8%AF%A5,0,0,1,0|you,%E6%9C%89,0,0,1,0|dixian,%E5%BA%95%E7%BA%BF,0,0,1,0

   把这堆编码过的字符转回来,是: 

http://ime.qq.com/fcgi-bin/reportword?key=d02e5d08310c90ac54d37089fbf3d8ed&num=11&xl=danshi,但是,0,0,1,0|zhe,这,0,0,1,0|bushi,不是,0,0,1,0|zaihe,在和,0,0,1,0|tengxun,腾讯,0,0,1,0|zuoweiyige,作为一个,0,0,1,0|shangshi,上市,0,0,1,0|gongsi,公司,0,0,1,0|zuoshihaishiyinggai,做事还是应该,0,0,1,0|you,有,0,0,1,0|dixian,底线,0,0,1,0

  你这时是不是只想向狗日的企鹅竖起中指呢?

 

  这是不是我没看清楚了,把ime.js仔细看了一下,tmd居然是混淆过的,看得我好累。谜底就在这里了:

ha = function () {
    
var e = [], a = new Image(11), b = false,
    j 
= function () {
        a.onload 
= a.onerror = null;
        b 
= false;
        J 
&& CollectGarbage()
    },
    r 
= function (w) {
        b 
&& j();
        a.src 
= w;
        a.onload 
= a.onerror = j;
        a.complete 
&& j();
        b 
= true
    },
    s 
= "", n = "",
    v 
= function () {
        
return s + "&num=" + e.length + "&xl=" + e.join("|")
    };
    
return {
        a:
        
function () {
            
var w;
            w 
= c.c();
            w 
= o.b("cgiPrx"+ "reportfirst?key=" + o.b("prvKey"+ "&version=632&sp=" + o.b("lnchr"+ "&sw="
                
+ screen.width + "&sh=" + screen.height + "&dw=" + w[0+ "&dh=" + w[1+ "&t=" + Ba;
            r(w);
            s 
= o.b("cgiPrx"+ "reportword?key=" + o.b("prvKey")
        },
        b:
        
function (w) {
            
if (S !== w) {
                
var l = w.length;
                
if (0 !== l) {
                    
for (var h = "", m = "", g = 0; g < l; g++) {
                        
var x = w[g],
                        k 
= encodeURIComponent(x.kanji);
                        e.push(x.spell 
+ "," + k + "," + n);
                        h 
+= x.spell;
                        m 
+= k
                    }
                    
1 < l && e.push(h + "," + m + "," + n);
                    
if (10 < e.length) {
                        r(v()); e 
= []
                    }
                }
            }
        },
        j:
        
function (w) {
            w 
= o.b("cgiPrx"+ "re?key=" + o.b("prvKey"+ "&ec=" + w + "&py=" + B.o() + "&t="
                
+ (+new Date).toString().slice(0-3+ "&v=632";
            r(w)
        },
        k:
        
function () {
            
if (0 !== e.length) {
                r(v());
                e 
= []
            }
        },
        l:
        
function () {
            
var w = 1 === o.b("iptMode");
            n 
= ["0", o.b("iptMode"- 1, w ? o.b("pyMode") : "0", w && 1 !== o.b("pyMode"? o.b("spType") : "0"].join(",")
        }
    }
} ()

  多贴点code,表示这是技术贴,不是5毛贴咯(听说涨7毛了,通胀太厉害了)。答案就在这个ha伪类的函数b里,这个b函数是用来记录输入历史的,但是在这个方法最后,做了一个判断:if (10 < e.length) { r(v()); e = [] }。e是存放输入历史的数组,方法r和v是负责组装和回发数据的,发完后清空了e。

 

  难道收集用户输入内容成了中国国情了?微软拼音2010还真的有这个功能,不过它会明确提示用户,并且只是发回那些用户纠正输入推荐,而且回发的内容也是用户可以很容易看到和编辑的。另外同样是web ime的百度输入法,回发服务器的信息是:

http://olime.baidu.com/py?py=baidu&rn=0&pn=20&t=1289460415974

  注意,这里没有key信息,这不是说百度就不能identify你,因为还有浏览器session_id,但是百度的输入法没有回发用户实际选词,所以是无法在服务期上还原用户输入的。

 

  虽然这是篇技术文章,但是肯定掺杂了莫名的立场,那我现在的立场就是:胁迫用户者不得好死!

posted on 2010-11-11 14:44 birdshome 阅读(35150) 评论(90) 编辑 收藏

评论

#1楼  回复 引用 查看   

据说好几个大boss都有靓号,可见tx的水有多深了

#2楼  回复 引用 查看   

赞,鄙视腾讯,看来腾讯的东西不能用了、
2010-11-11 16:35 | zeus2      

#3楼  回复 引用 查看   

没看明白
2010-11-11 16:46 | daodao      

#4楼  回复 引用 查看   

你的QQ聊天内容是不是都会经过腾讯服务器?
何必在意这个?

所谓云....是什么概念?

把用户的输入提交到腾讯服务器,有助于分析词法、语法,用户输入习惯等信息,这类内容可以理解狭隘小气的理解为偷窥你隐私,当然也可以理解为用于提高用户体验

试问,如果楼主腾讯内部员工或高层,你拿这么海量的用户输入何用?用于八卦和偷窥隐私么?喔,原来腾讯人都是隐私偷窥狂,我out了

在说了,不做回传,怎么做词频调整

唉,为何程序员的都如此单纯....
2010-11-11 16:46 | 小 雷      

#5楼  回复 引用 查看   

@小 雷
2B货一个
2010-11-11 16:49 | sheng.chao      

#6楼  回复 引用 查看   

要是输入的是银行账号和密码呢?
2010-11-11 16:53 | davieou      

#7楼  回复 引用 查看   

@小 雷

对啊,如此海量的数据是没啥用的,只需要找一些关键词,关键字,再顺藤摸瓜就对了。

小小的顶下LS好了。
2010-11-11 16:54 | icyleaf      

#8楼  回复 引用 查看   

被抢楼了。。囧rz...
2010-11-11 16:55 | icyleaf      

#9楼[楼主]  回复 引用 查看   

@小 雷
本来聊天是可以不经过服务器,但是现在我相信都被记录了,这个很大程度是party的需求,而腾讯能从中也能获益,就记录呗。
我专门在腾讯云输入法的主页找了半天,没有找到任何隐私声明和关于这个软件会静默上传用户输入内容的提示。这个不是小气大气的问题。
至于是不是不八卦和隐私,这些内容采集起来有数据挖掘的意义,而且如果你的输入内容足够多和所谓的敏感,确定你是谁不困难的。
2010-11-11 16:55 | birdshome      

#10楼  回复 引用 查看   

看来什么都不安全。。。。操作系统不知道默认传了多少隐私给USA GOV。。。。。
2010-11-11 17:03 | GreySky      

#11楼  回复 引用 查看   

哥哥你小心跨省哦。。。
2010-11-11 17:04 | GreySky      

#12楼  回复 引用 查看   

输入法,要想根据用户的习惯来调整输入的顺序,总得要记录用户实际选择的词不是出现在最前面的备选词,才能实现.
而,在线的输入法,不提交到服务器,就只能在客户端. 在客户端也有个问题,就是随着数据的增多会多耗用户资源.这里就有个取舍.

我一直用google的输入法,也会把常用词同步到云端. 不觉得是窥视用户数据.

可惜的是腾讯, 一日为贼,终身为贼.
2010-11-11 17:05 | hui      

#13楼  回复 引用 查看   

太恶心了,腾讯。

那一段JS我承认我第一遍看没看懂、
2010-11-11 17:07 | 古道轻风      

#14楼  回复 引用 查看   

搞不懂楼主怎么想的,web输入法不从服务器端取词库要从哪里取。
2010-11-11 17:27 | flowforever      

#15楼  回复 引用 查看   

既然要从服务器端取词就得把本地的词传回去了。
2010-11-11 17:28 | flowforever      

#16楼  回复 引用 查看   

牛就一个字。
2010-11-11 17:30 | Mr.司马      

#17楼  回复 引用 查看   

現在的輸入法爲了更精確的調整選擇次序,本來就是通過把用戶的選擇發送到服務端,然後分析數據。這沒什麽好奇怪的。
2010-11-11 17:37 | hikari      

#18楼  回复 引用 查看   

@flowforever
对于拼音输入而言,tx只需要知道用户给的字母就行了,比如你要打“腾讯”,你给个“tx”就行了,那么对于疼讯而言他只需要知道你输入了tx,而不是应该知道你要的是“疼讯”。明白?
2010-11-11 17:38 | Mr.司马      

#19楼  回复 引用 查看   

云输入法不这么输入怎么输入...js里面存词库为你取词吗?哪个云输入法不是这么实现的....说别人偷窥也不能随便掏出个家伙就往人头上扣的, 不如去看看百度的在线输入法搜狗的云输入法, 都没这么回传直接本地js组词的再来说腾讯偷窥不迟. 奇了怪了上面一帮支持的.
2010-11-11 17:43 | 木鱼      

#20楼  回复 引用 查看   

@flowforever
WEB输入法是要从服务器端取词,是需要把客户端输入传到服务器,但问题是他把用户最终选择的词也传回服务器了。
注意用户输入内容跟最终选择内容的区别。
2010-11-11 17:45 | 天行健 自强不息      

#21楼  回复 引用 查看   

哎,在天朝,神马大公司了,都是 party 的浮云而已

好久不见了
2010-11-11 17:47 | 寻自己      

#22楼  回复 引用 查看   

支持的人就慢慢用吧,被跨省了,被召唤了,被xxoo了也不要哭了。 果断用谷歌去。
2010-11-11 17:48 | Mr.司马      

#23楼  回复 引用 查看   

http://olime.baidu.com/userlog?py=huichanshujubu&res=%E6%85%A7%E7%A6%85%E6%95%B0%E6%8D%AE%E9%83%A8&context=&n=1&pg=1&no=1&t=1289468940853


试了哈,百度的也是会回传的.
2010-11-11 17:53 | hui      

#24楼  回复 引用 查看   

楼上的一些人看完了没有就乱喷。如果你要根据用户输入提高准确度。起码也得有个声明啊。tx那里写声明了。别看了一眼就在回复里面乱喷。
2010-11-11 18:01 | edjia      

#25楼  回复 引用 查看   

我用了微软拼音,没注意到提示。
技术人员也这么敏感,难道大家经常发一些会被跨省的信息? 感觉现在风声鹤唳的。要真发一些敏感的信息,建议最好不要用国内的任何服务
另外,发现支持360的人都喜欢口出脏话,不知道是什么原因?围观一下我引用 的这个人,我多次看到他口出脏话了。
引用sheng.chao:
@小 雷
2B货一个

2010-11-11 18:06 | Ray Wu      

#26楼  回复 引用 查看   

引用edjia:楼上的一些人看完了没有就乱喷。如果你要根据用户输入提高准确度。起码也得有个声明啊。tx那里写声明了。别看了一眼就在回复里面乱喷。

是的,腾讯应该写个声明的。
2010-11-11 18:12 | tubo      

#27楼  回复 引用 查看   

引用Ray Wu:
我用了微软拼音,没注意到提示。
技术人员也这么敏感,难道大家经常发一些会被跨省的信息? 感觉现在风声鹤唳的。要真发一些敏感的信息,建议最好不要用国内的任何服务
另外,发现支持360的人都喜欢口出脏话,不知道是什么原因?围观一下我引用 的这个人,我多次看到他口出脏话了。
引用sheng.chao:
@小 雷
2B货一个


我也发现了,支持360的人除了脏话,说不出来别的什么了。
也许因为他就是流氓的支持者的原因吧
2010-11-11 18:14 | tubo      

#28楼  回复 引用 查看   

用了百度首页的拼音,只有get,没有post, 也试了tx的,果然一段时间后会把用户的输入都post回去。
2010-11-11 18:14 | Mr.司马      

#29楼  回复 引用 查看   

为什么不支持tx就是支持360?

即讨厌360又恶心tx的飘过。
2010-11-11 18:16 | Mr.司马      

#30楼  回复 引用 查看   

这其实和在中国讲人权一样的,大家也没有保护隐私的习惯。所以腾讯也不会提醒我们了
2010-11-11 18:18 | 木由水      

#31楼  回复 引用 查看   

你可以说他是隐私问题,他可以说是词频调整、新词组收集,不然你以为搜狗、QQ、百度这些输入法哪来的这么及时的词库更新
2010-11-11 18:25 | Gray Zhang      

#32楼  回复 引用 查看   

@Mr.司马
如果从一开始就没人打“腾讯”这个词,他怎么知道TX是腾讯?
2010-11-11 18:27 | Gray Zhang      

#33楼  回复 引用 查看   

比较深奥,看不太懂
2010-11-11 18:44 | zeyoo      

#34楼  回复 引用 查看   

小马哥就是一皮条客,黄赌毒推手,你看QQ中都啥东西,就一实足大染缸,倒了吧,省的祸害更多人
2010-11-11 18:49 | Alvin      

#35楼  回复 引用 查看   

还是国外的东西靠谱 至少ms google不会让你被喝茶
2010-11-11 19:09 | 宇智波Q      

#36楼  回复 引用 查看   

其实腾讯推出来的东西并没有我们想象的那样,经过了严格的测试,在用户操作友好,信息公开方面并没有做到位,我就遇到了2次,QQ推出了浏览器5,我试用了一下,就给了个反馈,遇到了“未知明的错误”,第二天,腾讯的产品经理就联系我了,问我的机器环境配置,我说我是win2008服务器系统,他来了句,“哦,这么高级”,我问他是不是这个浏览器5还没有在win2008下测试过,他说“是的,我得马上提交报告,增加测试环境”,由此看出,tx并没我们想象中的那么的严格。都是为了抢占市场,而快速推出的测试品。
2010-11-11 19:13 | jolboy      

#37楼  回复 引用 查看   

现在我为了装上干净无比了概念版QQ,把win2008换成了win7,装了一个只能聊天,连远程功能都没有的概念版QQ,效果不错。
可惜,QQ浏览器5,第二个测试版出来,我遇到的那个问题,依旧存在。那个产品经理又找了我一次,还要我远程控制,让他操作一下,可惜啊,我装的概念版,没有远程,我就弄了个视频给他,他看完之后,我问他,是我机器的问题,还是你们软件有问题,他回答说“我们没有按照你那种操作方式去测试”,我当场就对他们产生了鄙视
2010-11-11 19:17 | jolboy      

#38楼  回复 引用 查看   

谢谢楼主写的这篇文章啊,这个输入法虽然不太实用,不过我觉得挺有创意,是个概念产品吧,挺好的。
2010-11-11 19:27 | llzhzhbb      

#39楼  回复 引用 查看   

@小 雷
哥,你不应该叫做小雷....
2010-11-11 19:36 | young40      

#40楼  回复 引用 查看   

好像是搜狗最早出的……
2010-11-11 19:45 | Jesse_Luo      

#41楼  回复 引用 查看   

@Gray Zhang
文章也说了,起码给个用户说明吧。
2010-11-11 19:57 | Mr.司马      

#42楼  回复 引用 查看   

虽然腾讯是个垃圾,但发这种输入法发回用户的最终选择是应该的也是必须的。比如你输入了“zd”,根据用户习惯不同,有些用户的第一选择是“知道”,而有些用户的第一选择是“战斗”或者是“自动”。现在的拼音输入法也都会根据用户的习惯来改变第一选择的词,不过非Web 的输入法是吧用户习惯储存在本地,然后做出调整,或者是用户登录后同步到服务器。而web输入法储存这些信息在本地根本不现实,要想在这点上做到差不多的用户体验,把用户的最终选择上传到服务器是必然的。不然所有用户输入zd之后的第一选择都会是一样的。
其实不用做分析代码之类的事就能知道会把用户的最终选择传到服务器,你看下他的介绍的第一条就知道了。
引用如何实现智能输入?

QQ云输入法会根据所有用户的输入习惯来调整候选词的排列位置,实现候选词的智能排列,提高用户的输入体验。

要现实这条说的东西就必然储存用户的选词习惯,而这种输入法显然不可能把选词习惯储存到本地。
当然没有给用户说明这肯定是腾讯不对,
2010-11-11 20:48 | 光锥之内就是命运      

#43楼  回复 引用 查看   

不管我输入的信息有没有价值,都不应该在不知情的情况下被收集!严重BS和抗议这种行为!!!
2010-11-11 20:59 | 小超001      

#44楼  回复 引用 查看   

引用Ray Wu:
我用了微软拼音,没注意到提示。
技术人员也这么敏感,难道大家经常发一些会被跨省的信息? 感觉现在风声鹤唳的。要真发一些敏感的信息,建议最好不要用国内的任何服务
另外,发现支持360的人都喜欢口出脏话,不知道是什么原因?围观一下我引用 的这个人,我多次看到他口出脏话了。
引用sheng.chao:
@小 雷
2B货一个



我承认我经常口出脏话,但是有一点我要声明:我不支持360,我也不用360或者类似的垃圾玩意。

我口出脏话主要是因为有些人的观点或者说的话确实是太2了,实在是懒得理论了
2010-11-11 21:08 | sheng.chao      

#45楼  回复 引用 查看   

引用sheng.chao:
引用Ray Wu:
我用了微软拼音,没注意到提示。
技术人员也这么敏感,难道大家经常发一些会被跨省的信息? 感觉现在风声鹤唳的。要真发一些敏感的信息,建议最好不要用国内的任何服务
另外,发现支持360的人都喜欢口出脏话,不知道是什么原因?围观一下我引用 的这个人,我多次看到他口出脏话了。
引用sheng.chao:
@小 雷
2B货一个



我承认我经常口出脏话,但是有一点我要声明:我不支持360,我也不用360或者类似的垃圾玩意。

我口出脏话主要是因为有些人的观点或者说的话确实是太2了,实在是懒得理论了



瞧瞧你这素质。。。啧啧!父母没管教好。
2010-11-11 21:37 | 万大大      

#46楼  回复 引用 查看   

@万大大
我素质比大多数人好。
但是我承认我的缺点就是看不上IQ低的人
2010-11-11 21:40 | sheng.chao      

#47楼  回复 引用 查看   

引用万大大:
引用sheng.chao:
引用Ray Wu:
我用了微软拼音,没注意到提示。
技术人员也这么敏感,难道大家经常发一些会被跨省的信息? 感觉现在风声鹤唳的。要真发一些敏感的信息,建议最好不要用国内的任何服务
另外,发现支持360的人都喜欢口出脏话,不知道是什么原因?围观一下我引用 的这个人,我多次看到他口出脏话了。
引用sheng.chao:
@小 雷
2B货一个



我承认我经常口出脏话,但是有一点我要声明:我不支持360,我也不用360或者类似的垃圾玩意。

我口出脏话主要是因为有些人的观点或者说的话确实是太2了,实在是懒得理论了



瞧瞧你这素质。。。啧啧!父母没管教好。



和他理论干什么,狗咬你一口,难道你要回咬么,哈哈
2010-11-11 21:40 | 小 雷      

#48楼  回复 引用 查看   

还好没用 腾讯输入法哦。、、、
2010-11-11 22:25 | 梦幻使者      

#49楼  回复 引用 查看   

技术7毛贴,推荐下
2010-11-11 22:48 | assiwe      

#50楼  回复 引用 查看   

强贴留名,一起鄙视。
2010-11-11 22:57 | 秋叶抚风      

#51楼  回复 引用 查看   

凡是输入法都是需要回传的,要不怎么做词频调整?
2010-11-12 00:43 | 蔡梓浩      

#52楼  回复 引用 查看   

就没有看明白。照这样说,其它的云输入法都不回传?
原来其它的云输入法都已经会心灵感应了。。。
2010-11-12 08:14 | kyle_ckzx      

#53楼  回复 引用 查看   

建议楼主去查查你和好友聊天时的消息是不是被腾讯传到服务器上了.
2010-11-12 08:43 | 猪笨无罪      

#54楼  回复 引用 查看   

腾讯没有钱赚的东西不会做。
2010-11-12 09:01 | 猫之良品      

#55楼  回复 引用 查看   

引用assiwe:技术7毛贴,推荐下

支持!@
2010-11-12 09:08 | 小小网虫      

#56楼  回复 引用 查看   

引用光锥之内就是命运:
虽然腾讯是个垃圾,但发这种输入法发回用户的最终选择是应该的也是必须的。比如你输入了“zd”,根据用户习惯不同,有些用户的第一选择是“知道”,而有些用户的第一选择是“战斗”或者是“自动”。现在的拼音输入法也都会根据用户的习惯来改变第一选择的词,不过非Web 的输入法是吧用户习惯储存在本地,然后做出调整,或者是用户登录后同步到服务器。而web输入法储存这些信息在本地根本不现实,要想在这点上做到差不多的用户体验,把用户的最终选择上传到服务器是必然的。不然所有用户输入zd之后的第一选择都会是一样的。
其实不用做分析代码之类的事就能知道会把用户的最终选择传到服务器,你看下他的介绍的第一条就知道了。
引用如何实现智能输入?

QQ云输入法会根据所有用户的输入习惯来调整候选词的排列位置,实现候选词的智能排列,提高用户的输入体验。

要现实这条说的东西就必然储存用户的选词习惯,而这种输入法显然不可能把选词习惯储存到本地。
当然没有给用户说明这肯定是腾讯不对,


嗯,说的对! 鄙视某些人!鄙视七毛!!
2010-11-12 09:09 | 小小网虫      

#57楼  回复 引用 查看   

如果腾讯是给美国人服务的呢?
2010-11-12 09:09 | 碎雨听音      

#58楼  回复 引用 查看   

纯打着技术幌子的7毛帖,鉴定完毕!
2010-11-12 09:21 | 恨离别      

#59楼  回复 引用 查看   

现在所有的输入法都这么搞搜狗,百度,QQ都这么干!
2010-11-12 09:22 | ToBin      

#60楼  回复 引用 查看   

博客园能不能增加一功能,让没博客的人不能发言,积分不到一定级别的人不能发言,五毛太多了!
2010-11-12 09:42 | 司徒正美      

#61楼  回复 引用 查看   

樓主說得好
胁迫用户者不得好死!
不用他的輸入法就Ok了
2010-11-12 10:06 | 咕嚕咕嚕      

#62楼  回复 引用 查看   

我一进来看到标题和下面评论的标题,我以为我的IE被我放大了400%....
2010-11-12 10:15 | Capricornus      

#63楼  回复 引用 查看   

果断围观.
2010-11-12 10:16 | 十二月的雪      

#64楼  回复 引用 查看   

云输入法本来就是要这么干的。。。 不然做个纯脚本和jquery一样下载就行了,还云什么。

微软拼音也上传,不过每次会有个提示要不要上传

#65楼  回复 引用 查看   

好吧。
有关这里的词频问题是针对个人的习惯调节的呢,还是大家共享的。
如果是个人的,就必须注册;如果是共享的,就没意思了。
现在是,不管对个人还是共享的词频,都只能对当前输入,以及最终选词做回传。每选一次词,回传一次。
现在的回传是整一句话了。
这个跟词有很大的差别。
2010-11-12 10:44 | hellion      

#66楼  回复 引用 查看   

引用韦恩卑鄙 v-zhewg @waynebaby:
云输入法本来就是要这么干的。。。 不然做个纯脚本和jquery一样下载就行了,还云什么。

微软拼音也上传,不过每次会有个提示要不要上传

你多讲点。
2010-11-12 10:55 | 必有方      

#67楼  回复 引用 查看   

从这个可以看出楼主不了解输入法,更不用说云端输入法了。
2010-11-12 10:58 | kooyu      

#68楼  回复 引用 查看   

小题大做了吧您,我一个孩子都知道为什么会回传,你可以不用啊,你随便选个输入法,用的舒服的哪个不给你传回数据啊。。。你去google搜索google不照样把你的搜索存进数据库了么,你觉得这两者有什么区别么
2010-11-12 11:02 | xaolo      

#69楼  回复 引用 查看   

打电话,发信息,移动联通电信想知道很简单,要是怕的就不要用
QQ聊天的内容都会存在QQ服务器,这有什么的,人家想看也会看
360杀毒也会把未知文件发送到服务器进行分析,360怎么会不知道呢
想自己的隐私不被知道,要会用传统方法,全都用笔记,安全点!!
360VSQQ 简直瞎扯!!
2010-11-12 11:28 | 杨贵泉      

#70楼  回复 引用 查看   

枪好多,不过很恶心TX,很少用他们的产品。
我很担心TX里的程序员。。。。。
2010-11-12 12:26 | 飘遥(Zhenxing Zhou)      

#71楼  回复 引用 查看   

@hellion
回传选词结果能调整词频,回传整句话的目的是智能造新词
2010-11-12 12:54 | Gray Zhang      

#72楼  回复 引用 查看   

@飘遥(Zhenxing Zhou)
这你放心,技术人员是纯技术的,TX被人恶心只是因为他的阴暗面被曝光了而已,每个企业都有这样的一面
GOOGLE这方面做得最好,我们都不知道GOOGLE用什么赚钱,所以骂不起来了
2010-11-12 12:55 | Gray Zhang      

#73楼  回复 引用 查看   

也许它的上传确实是出于技术的需要。但是必须明示用户上传了哪些内容以及为什么要上传(甚至包括可能发生的后果,例如未经加密的网络传输可能被黑客窃取),并且询问用户是否允许上传!
技术上需要就可以不经用户允许随意上传吗?如果我在编辑文档时 Word 崩溃了,它觉得需要把我正在编辑的文档上传以便找出 Word 崩溃的原因,但是如果我编辑的是机密文件呢?!如果我看图片时 ACDSee 崩溃了,它觉得需要上传我浏览的图片以便重现 Bug,但是如果我正在看艳照呢?!用户的任何数据都是用户私有的,无论任何理由、任何目的都不能随意上传。
PS:终于看到传说中的鸟食轩的帖子了!
2010-11-12 13:16 | 1-2-3      

#74楼  回复 引用 查看   

收集客户的习惯 和 收集隐私是两码事情吧。就像一个客人来你店里买东西,你总不能闭上眼睛,你要睁大眼睛看着她喜欢什么东西,然后给她推荐。这和隐私有啥关系。
2010-11-12 13:17 | 暮夏      

#75楼  回复 引用 查看   

其实,收集输入,提高用户体验本身没错的,可是,用户必须有知情权。只要有个选项可以让用户来选择是否上传自己的输入。

强制性的上传自己不愿意被上传的数据(苍井空),这样的软件,我一般称呼为“流氓”,坚决不用。

我只是发表我自己的观点。请勿人身公鸡
2010-11-12 13:27 | 低级程序员      

#76楼  回复 引用 查看   

在一个处处经过维稳后充满和谐的国度,背后收集用户的输入,这实在是太可怕了。这和在电脑里装了个截获输入的木马有什么区别?
2010-11-12 14:39 | 技术,趋势      

#77楼  回复 引用 查看   

擷取這類資訊
首要是要用戶同意
(就是安裝時大家都會忽略的那一長串法律文字)

像是 Google 透過 Google Toolbar 及 Google Chrome
大量回傳使用者各類資訊
不過都是表意成"用戶經驗改進計畫"

這是在進行這項工作時應該注意這件事
2010-11-12 15:40 | 胖胖安      

#78楼  回复 引用 查看   

打酱油滴。。。
2010-11-12 19:49 | Clyde Loh      

#79楼  回复 引用 查看   

跟你说实话吧:

1. 截止到微软拼音输入法为止的上一代拼音输入法如何我不知道,自从搜狗开始做和搜索关联的输入法,所有这些互联网公司都收集你的输入。

为什么要这样做?一方面,用户能提供无尽的语料,相比之下微软按照合法途径研究自然语言就只能在有限的渠道获取语料。搜索引擎是如何根据拼音识别汉字的?他们不需要好像微软一样购买大量的语料,他们只要发布一个输入法,让网民不停地输入,也就能知道你输入的拼音到对对应什么汉字。

另一方面,这样做更新速度快。微软拼音多少年才能做一个版本升级?尽管现在号称词库能够独立升级,但我还没见到它升级过。搜狗呢?不停地告诉你现在的热词是什么,那些热词怎么来的?不就是网民在自己电脑上输入的。

现在所有国内 Internet 企业做的输入法都如此,所以我还是只用微软拼音。

2. 所有有一定规模的社区服务,无论是 IM 还是 SNS 、论坛什么的,都要开专门的接口给有关部门,方便他们执行公务。至于某一个公务是否合理,这就在我们的讨论范围之外了,你需要知道的是任何上规模的社区都有后门就足够了。
2010-11-13 00:28 | Cat Chen      

#80楼  回复 引用 查看   

lw,礼物,0,0,1,0|aie,挨饿,0,0,1,0|gd,感动,0,0,1,0|dong,动,0,0,1,0|txiawude,他下午的,0,0,1,0|lsdkd,类似的肯定,0,0,1,0|ls,蓝色,0,0,1,0|fke,妇科,0,0,1,0|ofa,哦发,0,0,1,0|poef,破俄方,0,0,1,0|fjw,发觉我,0,0,1,0



俺的测试。腾讯有需要的话,是可以取得使用云输入的所有内容。

但就我的测试看来,目前的, http://ime.qq.com/fcgi-bin/reportword?key= 只是做输入统计反馈。

也就是说,你选的不是他提供的首要字词的话,他们要做统计,以便越来越准确!!!!
2010-11-13 10:02 | gelosie      

#81楼  回复 引用 查看   

呵呵,QQ云输入法没有记录用户的登录态,可以嵌入到任何一个网站去使用,试问怎么能够定位一个用户呢!如果无法定位一个用户,那么隐私又何从谈起。云输入法的目的就是为了让大家共享一份词库,从而提高输入的准确率晒!呵呵,很多同学以为自己搞懂了,其实呢,只是停留在事情的表面!
我试了一下http://ime.qq.com/fcgi-bin/getword?cb=window.QQWebIME.callback612&q=qq没有作者所说的session id也是一样的可以取词,或者更改这个key参数也是一样的可以选词!呵呵,如此来说,怎么来检测和确认一个用户的输入。
稍微做了一点测试后,发现这个key的目的很大的可能是为了更高效的来实现某种缓存的key来用的,如一些web服务器的前端缓存squid或者varnish的。
呵呵,搜狗和百度也有云输入法,两者都有上报用户选词的情况!如搜狗每次取词完都会上报。
http://web.pinyin.sogou.com/cloud_inputtime.gif?t=124&q=women&src=http%3A%2F%2Fpinyin.sogou.com%2Fcloud%2F&n=234086
百度也有,不过也是累计了一定的词后上报的。这是百度的上报:
http://olime.baidu.com/userlog?py=sd&res=山东&context=我们一起来看流星雨你说好么阿斯顿飞维尔
呵呵,相对而言,百度和腾讯做的是不错的,不是每次选词上报,而是累计了一定的词后进行上报,从而能够减少用户的负载!

呵呵,不要动不动就用隐私来说话,在没有搞清楚一些真相之前,会误导观众。
围观中!呵呵,当好一个观众也不容易!还得多少会点技术才行!悲了个剧!
2010-11-13 22:47 | mmtu321      

#82楼  回复 引用 查看   

呵呵,再次试了一下,发现每在新的页面打开qq晕输入法,得到的key都是不一样的。
2010-11-13 22:55 | mmtu321      

#83楼  回复 引用 查看   

哈哈 专门注册个帐号 来围观楼主
真是杯了个具
2010-11-14 08:48 | bithaha      

#84楼  回复 引用 查看   

这个问题啊 先理解一下云这个概念 再理解一下js这个东西……还有http……编码……
在中国你上网是没有隐私的,淡定……百度、搜狗、360都一样,D要整你就乖乖等死吧……
商业公司要赚钱、要生存……要乖乖听D的话……否则,google已经走了……
2010-11-15 00:02 | 老陈      

#85楼  回复 引用 查看   

已经在用谷歌拼音表示毫无压力
2010-11-15 05:48 | 夜闻香      

#86楼  回复 引用 查看   

我认为回传一个用户选择的数据,是正常的。毕竟这是云输入法,不然怎么根据用户的输入习惯调整回传的词!

如果怕隐私泄露的话,建议不要用云输入法。因为云输入法的机制都是通过服务器来处理。
2010-11-20 17:09 | endision      

#87楼  回复 引用 查看   

我也忍不住从reader上跳过来评论几句,如果博主是因为对技术和中国互联网行情不了解的话那还可以理解,但如果是360的7毛的话,那我必须鄙视你。
云输入法也不是腾讯第一家开始做的,搜狗很早就开始做了。而且回传用户输入信息有什么奇怪的,普通输入法只不过保存在本地这样,这样才能输入精准,云输入法没有这个条件当然要把数据发送到服务器上了。
再说隐私问题,这样确实有隐私问题,但是你觉得在中国互联网你能有隐私权吗?你能举出一个重视隐私的企业么,别拿360那种公司来说事。我最反感
2010-11-21 14:59 | Kevin Yang      

#88楼  回复 引用 查看   

楼主对腾讯有偏见
2011-10-03 16:30 | LOLj      

#89楼  回复 引用 查看   

楼主是小P孩吧
2011-11-22 13:31 | LOLj      

#90楼  回复 引用 查看   

***
2011-12-05 21:48 | guiren      

导航

公告

  原创技术文章和心得,转载必须注明来源"博客园"!
  贴子以"现状"提供,且没有任何担保,同时也没有授予任何权利。
昵称:birdshome
园龄:7年11个月
荣誉:推荐博客
粉丝:73
关注:3

搜索

 

常用链接

我的标签

随笔分类(337)

文章分类(147)

相册

Ex-Colleagues

常用链接

兄弟情深

积分与排名

  • 积分 - 3145044
  • 排名 - 6

最新评论

阅读排行榜

推荐排行榜