個人數字空間﹕聞聲識曲

Nayio Media Inc.美國首席運營長兼總經理傑伊•博斯(Jay Bose)擁有全世界最好的顧客:如果博斯提供的服務管用
﹐顧客會很高興﹔如果不管用﹐他們只會怪自己﹐不要求退錢﹐而且會再次嘗試。這是因為博斯和他韓國的同事意識到一件事情:大多數人都覺得自己的歌唱得很爛。

總部位於加州的Nayio在韓國推出音樂識別服務已經一年了﹐鮮京電訊(SK Telecom Co.)的用戶對著手機哼一段曲子﹐花兩美分就能收到短信回復﹐說出他們唱的可能是哪首歌。今年12月中旬﹐該公司向全球推出該項服務﹐在hsearch.nayio.com網站免費使用。通過在韓國的早期測試以及在近期一個展會的親身體驗﹐博斯明白一個道理:和他早期從事的聲音識別技術不同﹐當音樂識別服務識別不出是什麼歌曲時﹐用戶並不會責怪系統。“如果找出了正確的歌名﹐他們會很高興﹔說錯的時候﹐他們只會一笑了之。”博斯說道。

讓電腦識別出人們在唱什麼歌的想法早就存在﹐康奈爾大學(Cornell University)在1995年研發出一種軟件﹐能識別曲調的高低起伏──即所謂的“旋律輪廓”──並將其與數據庫中的183首歌進行比對。其他一些學者按此思路繼續研究﹐不過似乎是Nayio第一個將其用於商業服務﹐研究人們到底在哼什麼曲子。

而另一項類似的技術“聲紋識別”(audio fingerprinting)是將一段聲音與數據庫進行比對﹐直到發現匹配對象﹐這種技術已很常見。舉例而言﹐MusicBrainz軟件能掃描MP3音樂文件﹐猜出歌名﹐免得用戶自己把歌名標出來。Shazam服務讓用戶把手機靠近一個放音設備﹐然後通過短信告訴用戶正在播放什麼歌曲。索尼愛立信(Sony Ericsson)的一些手機也有類似功能。

Nayio的系統有所不同。博斯說該軟件比對的是旋律和曲調﹐而非音符。“我們不看音符﹐而是看每個樂符間的變化。”博斯說道。通過這種方式﹐軟件能構建歌曲的所謂遺傳識別(或密碼)﹐公司將其稱為“音基”(muGene﹐“音樂基因”的簡稱)。Nayio數據庫里目前有數千首歌﹐而且數目正在迅速增加﹐每首歌被分解為很多500字節的小檔案。用戶哼唱10-15秒鐘﹐系統將其轉換為一段代碼﹐與數據庫中的音基做比對﹐按相似程度列出所有可能的曲名及其相似度百分比。因此用戶從哪個音符開始、是否走調、甚至旋律快慢都是沒有關係的﹐只要每個音符彼此之間的關係相對正確就行。由於曲子都被轉換成數據量很小的代碼﹐因此搜索過程和Google一樣快:只要幾秒鐘時間。

使用效果如何呢?可以說好壞參半。一剛開始的嘗試非常順利─我哼了段甲殼虫樂隊(Beatles)的“昨日”(Yesterday)﹐被系統識別出來﹐相似度77%。不過﹐也許頭12秒的哼唱弄壞了嗓子﹐後面哼的歌都沒被識別出來。明尼•瑞普敦(Minnie Ripperton)的“愛你”(Lovin' You)被Nayio誤認為槍炮玫瑰樂隊的“你並非第一個”(You Ain't the First)﹐“白色聖誕”(White Christmas)被誤認為Amiga Mia﹐系統認為我演繹的Abba組合的“跳舞皇後”(Dancing Queen)有89%可能性應該是豪羅茵(Helloween)的“我活著”(I Am Alive)。甚至連“鈴兒響叮當”(Jingle Bells)都被誤認為艾拉妮絲•莫莉塞特(Alanis Morrissette)的歌。我妻子的使用情況也是如此:她一開始哼了段“可兒家族”組合的歌﹐被識別出來﹐但其它的都慘遭滑鐵盧。重要的是﹐我們兩個都沒有怪識別軟件﹐而是互相責怪。

意識到人們對自己唱歌不自信後﹐Nayio又推出另一種服務﹐使用的是同樣的音樂識別技術。博斯將其稱作“卡拉OK練歌房”﹐不過我寧願稱之為“卡拉OK狂想症”:用戶對著電腦唱歌﹐軟件會給出評價﹐從“真棒”到“這簡直…”等不一而足。用戶能通過簡單的評分系統將原唱和自己的表現進行比較﹐一段一段地練習﹐直到軟件不再冷嘲熱諷。如果你對自己的表現十分滿意﹐就可以通過網絡視頻錄下自己唱歌的過程﹐將其上載到Nayio網站﹐給大家品頭論足一番。不過﹐後果自負。

“鈴兒響叮當”這首歌是Nayio提供免費識別的曲目之一﹐之前嘗試的經歷讓我知道自己在唱歌方面確實有問題。事實上﹐畫面確實令人難堪。在唱罷第一首歌後﹐我妻子離開房間﹐沒有說她什麼時候回來。軟件在評價方面同樣嚴格﹐給我的評語一直是“差”或是“這簡直…”。

練習一下歌唱技巧確實是個好主意﹐對那些不滿意自己歌聲的人尤其如此。缺點在於:只有20首左右的歌是免費提供的﹔美國的用戶可以通過Nayio的合作伙伴Napster購買歌曲進行練習﹐該服務很快就會推廣到其它國家。

通過哼唱來尋找音樂的做法大有可為﹐不僅便於用戶搜尋CD和MP3文檔中的音樂﹐而且還能搜尋電影、電視劇和影像作品中的音樂。用哼唱方式搜索歌曲對音樂世界的意義可以與Google搜索對文字世界的意義相提並論。Nayio還沒有做到那種深度﹐不過已經相去不遠﹔到那時候它能幫我們練好唱歌在重要性方面恐怕就要退而居其次了。

Jeremy Wagstaff

(編者按﹕本文作者Jeremy Wagstaff是《華爾街日報》科技專欄“Loose Wire”的專欄作家﹐欄目內容涉及科技產品、電腦、軟件等相關領域。)
posted @ 2006-12-28 11:14  Rookie.Zhang  阅读(268)  评论(0编辑  收藏  举报