如何获取视频网站的信息(土豆例子)

现在不少的视频网站都提供转载视频的功能

我之前写过一篇CHSNS#中通过youku的视频网址获取视频截图及视频信息,虽然可能地址已经改了但却未涉及土豆网,其实土豆获取的方法与优酷是差不多的。

http://www.tudou.com/

其中的一个视频

http://www.tudou.com/programs/view/OiokB0Rohag/

我选择贴到博客,然后复制Flash播放器地址

image

 

这样我们使用这个地址(http://www.tudou.com/v/OiokB0Rohag)访问时就可以看到单个 的Flash

我们在使用火狐打开页面前打开FireBug,就可以分析到加载Flash前加载了一些数据。

我们可以看到其页面跳转到了http://www.tudou.com/player/outside/player_outside.swf?iid=42471321&default_skin=http://js.tudouui.com/bin/player2/outside/Skin_outside_17.swf&autostart=false&rurl=

而其中42471321应该就是视频的Id

在程序中,这个我们可以通过一个简单的WebRequest来读取。到而重定向的值一般在Header的Location中。

在播放视频后我们查看获取的文件看到有一个地址类似下面这个,(在程序中我们直接获取即可,nocatch只与FlV的HashKey有关,我们要获取的是基本信息可以不必管)

http://v2.tudou.com/v2/cdn?noCatch=22538&safekey=YouNeverKnowThat&refurl=&id=42471321

的文件,它的内容为:

<v time="279930" vi="1" ch="99" nls="0" title="&#20339;&#26408;&#26031;&#22823;&#23398;&#26657;&#22253;&#39118;&#26223;" code="OiokB0Rohag" enable="1" logo="0" wt="0" band="0"><a><f w="50" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374">http://218.60.33.9/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f></a><b><f w="1" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374">http://125.211.196.4/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f><f w="1" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374">http://119.147.178.9/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f></b></v>

 

其中Time是播放时间而Title是影片名的Unicode形式,code就是影片的编码我们可以看到前面的也几乎就是这个形式。

至于图片,其实在这里没有直接提供但是我们也可以根据其它的图片推算出来

http://i01.img.tudou.com/data/imgs/i/042/471/321/p.jpg 为其图片地址

4247132是其Id,结合方法应该很容易看的出来

posted @ 2009-12-16 13:41  重典  阅读(...)  评论(... 编辑 收藏