【AI打軸】日語字幕組和烤肉man的福音

解放雙手,提高效率,隨著AI時代來臨,越來越多的基礎性操作都可以用AI輔助完成,視頻字幕的生成也不例外,接下來將介紹兩種比較便利的日語字幕生成輔助工具
提示:以下兩種工具都只針對日語視頻
其他語言推薦自行試用AI語音識別模型Whisper(https://github.com/openai/whisper)
一、N46Whisper
乃木坂46(以及坂道系)字幕組們開發(fā)的基于 Google Colab 的應用
項目地址:https://github.com/Ayanaminn/N46Whisper/blob/main/README_CN.md
使用需要:能打開github和Google Colab、 Google Drive的網(wǎng)絡環(huán)境、Google賬號
需要在電腦的“修改"->"筆記本設置"->"硬件加速器"中選擇GPU模式
應用形式:Google Colab網(wǎng)頁
生成格式:含有時間戳和日語原文的ass字幕文件
如何使用:
在項目地址中找到<如何使用>章節(jié)
打開提供的Google Colab中應用網(wǎng)頁
依次點擊左邊的“播放”按鈕按照提示授權Google賬號
選擇提前在Google Drive里上傳的文件或者本地文件
選擇識別模型、上傳類型(視頻還是純音頻)、字幕分割模式和字幕格式
運行Whisper識別完成后ass字幕文件會自動下載到本地
備注:
如果選擇的是Google Drive文件
識別完成后Google Drive內(nèi)會自動添加該視頻的純音頻文件、ass和srt字幕文件
推薦提前將要處理的文件上傳到Google Drive以供直接選擇
本地文件上傳速度較慢,處理時間也會拖長
字幕分割模式下會將較短的無意義語氣詞單獨列出,需要手動刪除
識別語言只能是日語,本來就是針對日語字幕組開發(fā)的一款應用,所以打軸效果非常棒
拿我上一個實驗視頻為例,拿到的ass字幕只刪除了語氣詞和修改了幾個識別錯誤
其他的時間戳都沒有問題,也不需要調(diào)整,直接翻譯好壓制即可
字幕組開發(fā)大佬們也在不斷地更新優(yōu)化,本介紹基于2023/03/28的版本
使用限制:
例如視頻中出現(xiàn)明顯背景音,長時間空白和多人對話,都可能影響識別準確度。
如果視頻時間過長,對電腦配置的要求也越高,識別的時間也越久
其他功能:
基于ChatGPT的AI翻譯功能,默認翻譯成中文
翻譯后的文本將于原文合并在一行,以 /N分割,生成雙語對照字幕。
需要用自己Open AI的API key,免費版賬號會有限制
截圖步驟:





二、飛書妙記
使用地址:https://www.feishu.cn/product/minutes
使用需要:正常的國內(nèi)網(wǎng)絡環(huán)境、飛書賬號
應用形式:APP、PC客戶端、網(wǎng)頁版均可
生成格式:含有說話人、時間戳和日語原文的srt字幕文件(或者TXT、飛書文檔)
如何使用:
上傳本地文件選擇需要識別的語言(目前僅支持中文普通話、日語、英語)
等待轉(zhuǎn)碼和識別,識別成功后點擊進入,在右端顯示說話人和日語,左端顯示CC字幕樣式的視頻
使用限制:
同N46Whisper一樣如果遇到雜音過多、說話重疊過多等干擾因素,識別效果會相對較差
因為飛書妙記沒有分割功能所以有的句子會特別長需要在aegisub里手動分割
生成的srt字幕可能無法直接用aegisub打開,需要轉(zhuǎn)換為ass格式
可用的在線轉(zhuǎn)換網(wǎng)站:https://www.zimujiang.com/format/convert.html
說話人識別不準確,三個人只能識別成兩個
其他功能:
可以用飛書會議錄制外部聲音,錄下來的語音會自動在飛書妙記記錄識別
截圖步驟:




三、補充推薦
Buzz和WhisperDesktop
同樣是基于Whisper的應用
優(yōu)勢是不用聯(lián)網(wǎng)、完全免費,直接在本地處理、不用注冊賬號
字幕文件格式:帶有時間戳和日語原文的srt字幕文件
如果需要轉(zhuǎn)換為ass格式,可用的在線轉(zhuǎn)換網(wǎng)站https://www.zimujiang.com/format/convert.html
詳細介紹和相關下載:

四、軸man會消失嗎
個人覺得目前來說還不會,因為上述工具都只是生成最基礎的軸,后續(xù)調(diào)整樣式、刪除分割和各種特效依然依賴軸man的手動處理
什么,你說翻譯直接學了就行用不上特地找軸man了?啊,那沒事了
以下是個人認為軸man可以升級/轉(zhuǎn)型的幾個方向:
1.學習特效字幕,基于代碼操作的各種特效字幕、卡拉OK歌詞特效字幕等
2.學習日語,自己做翻譯,變身一體機
3.學習視頻剪輯成為整活區(qū)、MAD區(qū)、AMV區(qū)UP主
4.研究開發(fā)更高級的AI打軸應用
5.跟著UP的另一篇教程:漫畫漢化修圖嵌字,加入漫畫漢化組
五、日語語音轉(zhuǎn)文字的幾個拓展應用
1.輔助日語學習,自己練習聽寫后和AI生成的日語做對比,糾錯和查漏補缺,甚至可以自己練習口語,錄下來再丟進去識別看發(fā)音是否準確
2.輔助翻譯,經(jīng)常會有那么一兩個句子或一兩個詞聽不出來,AI生成可以幫忙識別出來是哪個句子/詞
3.輔助總結(jié),一些教程型視頻等學術內(nèi)容可以直接轉(zhuǎn)寫成對應的日語文本,方便做筆記/總結(jié)
六、最后
大家可以根據(jù)需求、硬件配置、網(wǎng)絡環(huán)境等條件來選擇適合自己的工具,或者多個工具互相輔助
如果有其他與AI打軸相關的實用工具歡迎補充推薦