日本語音產(chǎn)生發(fā)展現(xiàn)狀如何
來源:絲路印象
2024-11-27 03:27:59
瀏覽:4351
收藏
《日本語音生成發(fā)展現(xiàn)狀如何?》
隨著科技的不斷進步,日本在語音生成領域取得了顯著的發(fā)展。本文將深入探討日本語音生成技術(shù)的發(fā)展歷程、現(xiàn)狀以及面臨的挑戰(zhàn),為讀者提供全面的科普指南。一、日本語音生成技術(shù)的發(fā)展歷程日本語音生成技術(shù)的發(fā)展可以追溯到20世紀80年代。當時,日本的研究機構(gòu)和企業(yè)開始致力于開發(fā)能夠模擬人類語音的技術(shù)。1939年,海倫·凱勒訪問日本之際,捐贈了“讀本器”和唱片播放設備,這標志著日本有聲讀物事業(yè)的起步。1970年,以東京都日比谷圖書館為代表的圖書館開始向視力方面的殘障人士提供錄音服務。2010年,日本圖書館協(xié)會舉辦研討會,討論多媒體DAISY圖書的推廣問題。進入21世紀后,隨著智能手機的普及和互聯(lián)網(wǎng)的發(fā)展,日本的語音生成技術(shù)得到了快速發(fā)展。2007年,新潮社等約100家日本出版社曾效仿美國面向普通大眾推出了CD為載體的有聲讀物產(chǎn)品,但并未取得成功。2011年后,隨著智能手機的普及,有聲讀物的消費者不斷增加。2015年,Audible旗下的亞馬遜開始進入日本市場,目前主要有Audible、audiobook.jp、himawari(喜馬拉雅)、LisBo(DigiBook)等互聯(lián)網(wǎng)公司打造的有聲讀物品牌。二、日本語音生成技術(shù)的現(xiàn)狀株式會社OTOBANK是日本有聲讀物領域最具代表性的互聯(lián)網(wǎng)公司之一。該公司成立于2012年,主要經(jīng)營網(wǎng)絡銷售書籍、雜志、音樂軟件、影像軟件等業(yè)務。2017年,OTOBANK在日本首次開設線上店鋪,并于2011年后開始涉足有聲讀物市場。2015年,Audible旗下的亞馬遜也開始進入日本市場。目前,日本的有聲讀物消費群體主要是三四十歲的人。這些消費者大多在通勤電車中收聽有聲讀物,其他區(qū)域的消費者則多在駕駛汽車時使用。由于對某類內(nèi)容或某聲優(yōu)的喜愛,許多年輕人和老年人也成為了有聲讀物的消費者。此外,一些互聯(lián)網(wǎng)公司如ATB公司推出的《分級別日本語多讀圖書館》系列圖書,包括電腦端和手機端兩種音頻格式,也在亞馬遜和樂天等圖書零售網(wǎng)站上銷售。三、日本語音生成技術(shù)面臨的挑戰(zhàn)盡管日本的語音生成技術(shù)取得了顯著的發(fā)展,但仍面臨一些挑戰(zhàn)。首先,出版社與互聯(lián)網(wǎng)公司之間圍繞有聲讀物開發(fā)主導權(quán)的爭奪尚未明確。傳統(tǒng)出版業(yè)認為數(shù)字時代的出版主角是有聲讀物著作權(quán)所有人和出版社,而互聯(lián)網(wǎng)公司則看好有聲讀物的未來前景,并積極投入技術(shù)開發(fā)和市場推廣。然而,兩者融合尚不明朗,出版社對有聲讀物的態(tài)度大多處于被動接受的狀態(tài)。其次,法律制度上的障礙也限制了日本語音生成技術(shù)的發(fā)展。日本著作權(quán)法第37條第3項的規(guī)定對“視覺障礙者以及其他對通過視覺表現(xiàn)出來的東西存在認知障礙的人”,可以由“從事福祉行業(yè)的人或政府法令規(guī)定的人”在沒有獲得著作權(quán)方授權(quán)的前提下制作錄音圖書并提供給公眾。但在制作第二個類別的有聲讀物時,互聯(lián)網(wǎng)公司需要單獨取得出版社和著作權(quán)所有人的單獨授權(quán)。這不僅增加了有聲讀物制作的難度,拉長了產(chǎn)品制作周期,而且限制了數(shù)量的大幅增長和品種的豐富性。最后,“質(zhì)”與“量”的平衡也是日本語音生成技術(shù)面臨的一個重要問題。雖然市場上出現(xiàn)了大量的有聲讀物作品,但如何在保證質(zhì)量的同時實現(xiàn)數(shù)量的增長仍是一個亟待解決的問題。綜上所述,日本在語音生成領域取得了顯著的發(fā)展,但仍面臨一些挑戰(zhàn)。未來,隨著技術(shù)的不斷進步和市場的日益成熟,相信日本語音生成技術(shù)將會迎來更加廣闊的發(fā)展前景。