- 作者:音樂(lè)學(xué)院
- 時(shí)間:2022-08-26
- 點(diǎn)擊:2664
- 來(lái)源:音樂(lè)學(xué)院
近日,我校音樂(lè)學(xué)院青年教師李佳佳在國(guó)際權(quán)威期刊《IEEE Access》(SCI索引,中科院二區(qū)Top,影響因子: 4.34)上發(fā)表題為“A Fuzzy Training Framework for Controllable Sequence-to-Sequence Generation”的研究論文,實(shí)現(xiàn)了我校在該國(guó)際頂級(jí)期刊上新的突破!
錄用截圖
該研究在人工智能+音樂(lè)的背景下,提出了一種基于采樣懲罰的可控音樂(lè)歌詞生成訓(xùn)練框架。這種框架非常適合中文歌詞生成任務(wù),在給定關(guān)鍵詞的前提下,可以不訓(xùn)練多個(gè)模型的情況下同時(shí)支持端到端歌詞生成以及可控歌詞生成,從而達(dá)到綠色人工智能的目標(biāo)。
本研究提出了一種基于模糊訓(xùn)練框架的音樂(lè)歌詞可控生成的方法及系統(tǒng),在訓(xùn)練框架中采用兩種模式進(jìn)行交叉生成訓(xùn)練。對(duì)目標(biāo)序列進(jìn)行采樣以模擬給定的受限詞,同時(shí)在損失上對(duì)這些采樣詞施加額外的懲罰。模糊訓(xùn)練框架使得模型同時(shí)支持非限制和受限的音樂(lè)歌詞生成,大大減少了額外的訓(xùn)練時(shí)間消耗。并且由于模糊訓(xùn)練框架將受限詞的約束體現(xiàn)在模型結(jié)構(gòu)以及訓(xùn)練損失上,而無(wú)需擴(kuò)大搜索空間,因此推理速度有很大的提升,極大地提高了音樂(lè)歌詞可控生成的實(shí)用性。
IEEE全稱(chēng)Institute of Electrical and Electronics Engineers,是美國(guó)的一個(gè)電子技術(shù)與信息科學(xué)工程師協(xié)會(huì),也是當(dāng)前世界上最大的非營(yíng)利性專(zhuān)業(yè)技術(shù)學(xué)會(huì),會(huì)員人數(shù)超過(guò)40萬(wàn)人,遍布全球160多個(gè)國(guó)家。在電氣、電子、計(jì)算機(jī)工程和科學(xué)有關(guān)的開(kāi)發(fā)和研究,制定了900+的行業(yè)標(biāo)準(zhǔn),現(xiàn)在已經(jīng)是國(guó)際影響力巨大的學(xué)術(shù)組織。
李佳佳,女,中國(guó)音協(xié)“西方音樂(lè)史學(xué)會(huì)”會(huì)員。曾師從武漢音樂(lè)學(xué)院音樂(lè)學(xué)系田可文教授,攻讀西方音樂(lè)史,獲文學(xué)碩士學(xué)位。現(xiàn)為漢口學(xué)院音樂(lè)學(xué)院青年教師。研究方向包括中國(guó)傳統(tǒng)音樂(lè)、中西音樂(lè)的交流、以及人工智能音樂(lè)創(chuàng)作。