外文翻译:关于谷歌基于位置的服务(LBS )的一份报告副本
Google在今天向几个国家的数据保护机构提交的用在Google基于位置的服务(LBS)中的基于汽车采集的wifi数据集的副本
概述
Google的基于位置的服务依赖于各种信号来尝试为用户提供一个近似的位置信息。
这些信号数据包括GPS,以及手机信号塔位置和wifi访问点位置。
Google 通过各种方式来收集手机信号塔的wifi访问点的位置信息。包括使用有手持设备和计算机应用程序提供的信息,以及汽车上安置的无线电接收器提供的信息。
Google定位服务会使用很多媒介来收集wifi访问点信息给Street View(街景)服务使用,Google为了减少重复使用这些媒介做了不少工作。然而Google定位服务对于Street View服务来说是一个相对独立的产品,它和Street View之间的联系仅仅是共同使用了物理媒介和设备收集的数据。
关于wifi访问点信息的收集是被动的,仅仅在这些数据在wifi无线网络中公开发布后才会收集到。这些数据对任何拥有一个wifi接收器——包括其他拥有类似笔记本电脑和智能手机等可启用wifi的设备的人都是可见的。
上面说的数据被Google手机在一个聚集体中,而不是绑定在任何特殊用户上。这些聚合体中数据用来提高基于位置的服务的品质,而不是直接分享给用户们。返回给用户基于位置的服务的信息的应用程序仅仅接受独立于用户请求的地理编码信息,他们不接收关于访问点额外的信息。
访问点操作器可能会对它们广播的数据进行个人化(比如改变默认SSID至一个完整名字),这样做的话它们可以选择去把这些数据广播给公共区域内任意具有wifi功能的设备。不管怎么样Google都不会在其基于位置的服务中公开这些SSID(服务集标识符service set identifier)。
Google基于位置的服务相关的数据
Google通过公开免费的地理位置API(应用程序接口)向很多使用它的产品或者其他产品的经营商和用户提供基于位置的服务。
基于位置的服务依赖于各种和用户设备相关的位置指示器来帮忙识别用户设备位置。比如带有GPS(全球卫星定位系统)的设备能够提供一个来自卫星的高精度的地理位置编码信息。可是,许多设备没有GPS功能或者在一个收发GPS信号需要很长时间的环境中使用,更有可能在一个没有GPS信号的环境中(比如在室内,设备无法接收到卫星信息)。因此其他的位置指示器也经常用于帮助用户来定位他们的设备,尽管他们可能没有像GPS那样高的精确程度。这些指示器包含与手机信号塔的临近程度和与wifi访问点的临近程度。
为了能够使用这些位置指示器,Google收集信息来创建了一个数据库,这个数据库包含了了已知的手机信号塔和wifi访问点。这些信息是通过各种手段收集的,包括使用有手持设备和计算机应用程序提供的信息,以及无线电接收器提供的信息。Google并不是唯一收集这些数据的公司,许多世界范围的公司也在同样的事情,比如Skyhook公司已经在世界上许多地方收集了类似的数据,甚至仅在德国国内就有许多公司参与到了同样类似的工程,比如Gammax System GmbH,Magic Map,1T2media 和 Frauhfer Institute等项目。
作为Google公司的部分努力成果,它支持了一个国际化的项目,这个项目使用基于交通工具的无线Wifi接收器来收集有车辆行驶的区域的Wifi访问点信息。
具有实际意义的是,Google通过适用于同样的媒介上的设备来收集数据,这些设备收集的是用在像Google Maps(Google地图)类似产品上的Street View(街景)画像和三维激光数据。这些仅仅联系在基于位置的服务与Street View类产品的数据是被公用于实际和商业目的的。
我们收集的wifi访问点信息是众所周知的,事实上在Wikipedia(维基百科)有记录,它也在New York Times(纽约时报)上的几篇文章中谈到过。我们同样也提供了关于我们基于位置的服务和位置指示器的丰富信息,这些都能在我们各种各样的博客上看到的。比如说My Location feature on Maps for mobie, My Location on the desktop, Gears geolocation API等文章。
这门技术是怎么运作的呢?
显而易见的是每个车辆的车顶上都附加了商用的Maxrad BMMG24005全向天线。这些天线接收车辆能收到的范围内的公开广播无线wifi信号。
这些车辆以一个正常的速度行驶,因此仅仅花费少量时间在能收到信号的范围内和wifi访问点进行通讯。
这些信号在车辆装载的计算机中用相关软件进行初始化处理,这些软件包括使标准的kismet开源应用程序。这些数据会在转移到Google数据中心后进一步被处理,然后被用来编译成Google的基于位置的服务的数据库的数据项。
那些装备在车辆上的设备是被动运转的,接收广播的信号,但不主动寻找和对访问点进行通信。
这些对车载设备可见的信号是通过无线电网络公开广播的,它们参照802.11信号标准编码。这个信号标准包含802.11b/g/n协议。
这些车载设备能够接收任意广播帧中的数据。它们包括来自头文件的、SIID和MAC(Media Access Control 介质访问控制)地址。但是,所有来自数据帧的负载数据会被舍弃,所以Google从来不收集任何通讯的内容。另外,此外,访问节点的运营商可以选择具有限制的SSID广播,也就是说在许多情况下这意味着这些SSID不会被搜索到(尽管这会随访问接入点的方式而发生改变)。
上述的车载设备同样也能独立记录广播的下信号长度和频道,这些广播能够被我们的设备搜索到且使用可建立的通讯协议(802.11b/g/n协议)。
如果一个接入口是加密的,那么我就可能从收到数据中辨识出它来,这些辨识信息可能包含在帧头中,但在任何情况下帧内存在加密将是不言而喻的。
我们怎样使用wifi接入口数据
我们所收集的数据是用来提供给使用基于位置的服务的产品和使用地理编码API的用户们的。比如使用Google Maps的智能手机用户可以打开“My location(我的位置)”来找到自己的近似的位置。这些位置数据信息是根据手机信号塔和wifi接入口来确定的,这些接入口对设备来说是可见的。同样的道理,像Twitter这类网站用户能够使用基于位置的服务来增加地理编码位置信息到他们的消息中,从而来获得更好的聊天上下文。
Google现在正使用两份数据从驾驶操作中获得数据来建立对应的信息数据库和提供基于位置的服务,这两份数据分别是wifi接入口MAC地址信息和可以获得的汽车实时GPS坐标。
这些数据被存储在一个聚集表中,被用来提供基于位置的服务。
Google的基于位置的服务像下面一样使用使用wifi接入口数据:
●用户设备向Google位置服务器发送一条请求,这个请求包含设备当前可知的接入口MAC地址列表
●位置服务器将这些用户设备上传的MAC地址列表和已知的MAC地址列表进行对比,然后辨别出相关联的地理编码位置信息(例如经度和纬度)。
●位置服务器使用这些地理编码的位置信息和可见的MAC地址以计算出近似的位置信息
●这个近似且被地理编码的位置信息会被返回给用户的设备
Google唯一公开的数据是的地理编码表,这可以用来将上传MAC地址和一直MAC地址对比得出近似的用户位置信息。在任何时刻,Google都不会公开用户上传到数据库的 MAC地址信息(和一些德国和其他地方的位置信息提供者不同)。
有人推测Google会制作一个开放的地图,这个地图上有着各个wifi接入口的对应地理信息等,包括辨识到的开放的wifi接入口的SSID。但这个Google是不会提供这样的服务的。
原文:Raphael Leiteritz,产品经理,Google,27/04/2010

浙公网安备 33010602011771号