加载中,请稍候…

资讯 英语
舍得茶室 方法
SuperMemo Rosetta
TellMeMore Aboboo
课程 视频
软件 电子书
学苑 博客
空间 微博

语音版六人行句库制作手记

2009-05-14 00:00:00   来源:舍得学习力博客  作者:admin

 

 

一、To be,or not to be

写这篇文章是经过一番犹豫的,写呢?还是不写?后来舍得想到,将制作过程写出来,不仅仅是教会大家一种六人行句库制作方法,更会对大家制作其它句库词库一种启发,而且可以让更多的人来投入到SuperMemo句库和词库的制作中,这样就会有更多的人利用SuperMemo来学好英语。

“不想写”其中最大的一个原因就是,文章中介绍到的一个关键工具Q99,大家如果要用的话,是必须付费注册的,舍得在这里不会提供注册码之类的东西。如果没有这个工具,那么,语音版的制作就没法实现了。这是一个最大的问题。

但是,比起工具,思路更重要,对吗?

 

二、工具和材料的准备

1.当然是《六人行》的视频版的下载啦,舍得用的版本大家可以从这里下载:VeryCD下载

2.Alive
MKV Converter 1.0.3.8,它主要是用来提取MKV文件的音频,这是注册版:BiBiDu下载

3.VirtualDubMod 1.5.10:用它可以提取中英文的字幕:BiBiDu下载

4.LrcCon
3.0.1:免费软件,用它来将SRT格式字幕转换成LRC歌词格式:BiBiDu下载

5.Q99复读机:本例中用到的重要工具之一,用它可以通过LRC歌词将Mp3文件断句,它自带的断句功能也很实用,不提供注册版,试用版将会有导出句数的限制。它的同类软件有世界之音复读机和Langstream复读机。如果大家发现有更好的软件可以代替,请通知舍得一声。试用版下载地址

6.EmEditor8.0.4:不需要讲太多了,做词库少不了要用到它,它的正则表达式和宏实在太方便了。

BiBiDu下载

7.Microsoft Excel:这个大家自备吧。Excel主要用来将中英文字幕对齐。

8.视频编码包K-Lite Mega Codec Pack 4.4.5,处理MKV格式文件时可能要用到它:华军软件园下载

9.ACDSee
2.44:基本上任一个版本都可以,主要用它来进行批量改名:BiBiDu下载

10.可能要用到的一个软件:Samplitude V8,专业音频处理软件,用它来将Alive MKV
Converter导出的Mp3文件音量放大。VeryCD下载,目前该软件已经出到V15了,但舍得没用过,大家可以去下载下来玩玩,不作推荐:VeryCD下载

 

 

三、字幕提取

好,下面正式开工。

1.运行VirtualDubMod,这是个英文版软件,但没关系,我们只用到它一点点功能。

 

2.打开菜单“File->Open Video
File”,选择下载好的六人行文件(MKV格式,如果你打不开,说明你需要装一个MKV的编码包,可先安装K-lite Mega
Codec Pack,MKV的编码包名为Matroska):

 

3.打开后会出现一个warning对话框,不要管它,点击确定继续:

 

4.打开菜单“Stream->Stream List”:

 

5.此时窗口内共有3个文件,2和3就是我们要的字幕文件了,选择2,然后点击下边的Dumax按钮:

 

6.输入一个文件名,如105.cn,软件自动会加上扩展名SRT。

 

7.用同样的方式将3保存为105.en.srt。

 

这样我们便拥有了两个字幕文件。

 

三、字幕预处理

合并之前先处理一下,也就是说,将双行的英文和中文字幕分别并成一行,便于下一步的合并操作。

1.用Emeditor打开105.en.srt和105.cn.srt,打开“查找->替换”菜单:

 

2.勾选“使用正则表达式”选项,下同。

查找:([^/d])/n([^/d])

替换成:/1/2

要点:[^/d]表示除数字外的其它字符,通过这条语句能够查到两行相连的中文或英文,查到后将中间的回车符去掉就行。

 

你也可以编制一条宏来处理,这样以后不用老是去输入搜索定义条件,将下面的文本保存成jsee格式的文件就可以在emeditor中调用它:

document.selection.Replace(“([^//d])//n([^//d])”,”//1//2″,eeFindNext | eeReplaceAll |
eeFindReplaceRegExp);

 

四、字幕合并

合并是为了将英文和中文关联在一起,方便制作Q&A格式的文件。

1.打开Excel,建立一个空的电子表格文件。

 

2.在Emeditor中将105.en.srt文件的文本全选,然后按Ctrl+C复制:

 

3.点击Excel文档中的第一行第一列,然后按Ctrl+V进行粘贴。

 

4.在Emeditor中将105.cn.srt文件的文本全选,然后按Ctrl+C复制:

 

5.点击Excel文档中的第一行第二列,然后按Ctrl+V进行粘贴。

注意顺序不要搞乱,英文在左,中文在右。

 

6.保存这个Excel文档,然后调整一下列宽。

 

7.原则上左边一列的内容不要动它,以保证其字幕的序号不变。这时我们可以看到右侧的字幕跟左侧会有一些出入,逐一进行调整。这是一项相对比较烦琐的手工活,但一集六人行的台词量也不多,大约是300行上下(每行内容多少差异挺大)。

 

8.调整完后,打开菜单“文件->另存为”,将它保存为文本文件(制表符分隔)的格式。这里舍得保存的文件名叫105.txt。

 

五、导入前处理

1.用Emeditor打开刚才Excel处理完的文件105.txt,打开菜单“查找->替换”:

 

2.先将多余的序号给删掉:

查找:(^/d{1,3})/t.*?$

替换成:/1

 

3.删掉时间码那一行:

查找:^”/d/d:.*?$/n

替换框内留空

 

4.添加音频文件路径:

查找:(^/d{1,3})/n(^/D.*?)/t(.*?$)

替换成:Q: /2
<bgsound src=”file:///d:/media/f6/season1/105//1.mp3
LOOP=TRUE>/nA: /3

要点说明:这段比较长,我们一段一段来讲:

1)(^/d{1,3}):这是字幕的序号,用它来作文件名,在替换框里我们用“/1”来调用它。

2)(^/D.*?):/D相当于上面[^/d],即除数字以外的字符,在本例中这一串即表示字幕中的英文部分,在替换框里我们用“/2”来调用它。

3)/t(.*?$):/t是指TAB空格,用它来分隔中英文,所以括号内的内容即字幕中的中文部分,在替换框里我们用“/3”来调用它。

4)<bgsound src=”file:///d:/media/f6/season1/105//1.mp3
LOOP=TRUE>:这里的内容基本上是固定的,唯一的变化就是其中的”/1″,这是mp3的文件名,注意每一集最好单独建一个文件夹。要修改音频文件路径的话可以在这里改动,d:是盘符,media是第一层文件夹,F6是第二层,依此类推。

 

 

这里同样可以编制一条宏来处理,将下面的文本保存成jsee格式的文件就可以在emeditor中调用它:

document.selection.Replace(“^(//d{1,3})//t.*?$”,”//1″,eeFindNext |
eeReplaceAll | eeFindReplaceRegExp);
document.selection.Replace(“^/x22//d//d:.*?$//n”,”",eeFindNext |
eeReplaceAll | eeFindReplaceRegExp);
document.selection.Replace(“(^//d{1,3})//n(^//D.*?)//t(.*?$)”,”Q:
//2 <bgsound
src=/x22file:///d:/media/f6/season1/103///1.mp3/x22
LOOP=TRUE>//nA: //3″,eeFindNext | eeReplaceAll |
eeFindReplaceRegExp);

六、提取MP3

从六人行文件中提取Mp3音频文件:

1.运行Alive
MKV Converter,点击“ADD”按钮,选择事先下载好的六人行视频文件(mkv格式):

 

2.点击“Convert”按钮,设置Output Format为Mp3 Audio格式,Audio
Bitrate设为64Kbps,Sample Rate为44100Hz,Channels设为mono(单声道),然后在Output
Folder中设置导出文件的保存位置:

 

3.点击“OK”按钮,程序开始提取音频:

 

提取完的Mp3文件若音量不够大,则需要使用Samplitude进行音量放大(也有其它类似的软件可以使用),这里的过程略过。

 

七、歌词转换

将105.en.srt转换成LRC歌词格式,方便Q99的调用:

1.打开LrcCon 3.01。

 

2.点击“浏览”按钮,选择105.en.srt文件:

 

3.点击目标格式下方的“LRC歌词文件”,保持其它选项不变,这时生成的LRC文件将与源文件在同一文件夹下:

 

4.点击“转换”按钮。

 

八、自动断句

利用上一步生成的105.en.lrc文件,加载到Q99中给Mp3文件进行断句:

你也可以利用千千静听对LRC歌词进行校正,不过目前为止,舍得发现这个版本的六人行(视频)文件,字幕已经是比较精准的。

1.运行Q99,打开第六步中提取出来的MP3文件,舍得一般会给该文件改名,如改成105.mp3:

 

2.打开菜单“断点设置与管理->加载当前音频的LRC文件”:

 

3.保持默认的“使用LRC的时间戳进行断句,并加载句子内容作为该音频文件的参照文本”不变,点击“确定”继续:

 

4.弹出一个确认对话框,点击“是”继续:

 

5.一般这个时候LRC文件的断句是比较精准的,直接导出就可以了。点击右下方的“句子”菜单,从弹出的菜单中选择“批量导出选中的句子为Mp3文件”:

 

6.点击“浏览”按钮选择保存路径:

 

7.点击“Mp3导出”按钮,此时导出的Mp3是经过断句处理的。

 

九、批量改名

上一步中导出的Mp3文件,一般按照Q99的命名规律为105_XXX.mp3,需要改一下文件名。

先确定一下第一句和最后一句的文件内容是否与105.txt中的内容相符。

1.打开ACDSee,舍得这里用的是2.44版(不需要多新的版本)。

 

2.定位到保存有断句Mp3的文件夹,先点文件名排一下序,这个很重要。

 

3.然后选中全部文件,点击鼠标右键,从弹出的快捷菜单中选择“重命名序列”:

 

4.模板里输入#,开始于后边输入“1”,注意核对一下,不要改错了。点击确定继续:

 

你也可以使用Total Commander的改名程序来进行批量改名,事实上Total Commander的命名要更加方便一些。

 

十、校正文件,添加注释

下面的工作就比较简单了,不过工作量可不小。

1.将断好句改好名的mp3文件放到d:/media/f6/season1/105文件夹中(你若要将这些文件放到其它的位置,可修改105.txt文件中的路径)。

 

2.用emeditor打开105.txt文件,如果你装有mp3播放器的话(推荐使用千千静听),直接点击“file:///d:/media/f6/season1/105/2.mp3”这样的链接来试听每一个mp3文件,若有断句不准确的地方,需要进行个别修整。具体的修整办法请参看Q99的帮助文件,或者单独地咨询舍得,这里不再赘述。

 

3.这里舍得通常会删掉一些意义不大的短句,也会根据实际情况对句子进行拆分或合并。

 

4.然后就是注释的添加,舍得会在这里加入一些自己的心得,或者是参考一些朋友写的《六人行》笔记,帮助大家更好地掌握《六人行》中的句子。

 

十一、转换格式

这是最后的一步工作了,当上面所有工作完成的时候,你别忘了将它转换成“中欧ISO”编码格式,这样你才能在SuperMemo中导入它。具体的方法请参看《SuperMemo2006之词库制作篇(中)》。

 

十二、后记

不知不觉写了那么多,不知道这样复杂的操作步骤会不会吓到大家呢?在这个制作的过程中,用到的工具之多,是之前的文章中从未有过的。舍得写这篇文章,最重要目的并不是让大家照搬这套方法去制作,而是希望能给大家一些启发,上山的路有很多条,大家完全可以去找出对自己最合适、也最方便的路来走。

另外补充一点,Mp3格式的Friends舍得有3个版本,一个是下载的,一个是买书时送的,还有一个就是自己在2004年为练听力而制作的。为什么舍得会选择从MKV文件中提取,而不用现成的Mp3呢?原因很简单,就是为了利用其中现成的字幕,在本例中,字幕时间码的精确程度很重要。如果大家有mp3的歌词文件的话(中英文都有吗?),那就可以跳过视频文件的下载、提取等工序了。

最后舍得希望大家能够记住,工具只是工具,学习更加重要。千万不要沉迷于工具的把玩,而忽视了学习,这就得不偿失了。



【TAGS】
supermemo 使用 技巧 入门 教程 新手 指南 六人行 Friends 老友记
【相关文章】
  • 【十二月福利】《驾考宝典》之科目四(SuperMemo)
  • 如何打开SuperMemo课程中隐藏的练习?
  • SuperMemo新手指南之版本的选择
  • 新版《六人行》课程推出,老客户可免费更新
  • 16分钟!重新制作一季《六人行》只需16分钟!
  • SuperMemo UX新手指南:如何手动加入音频,并自动播放
  • SuperMemo UX问答篇:如何用SuperMemo来学好拼写?
  • SuperMemo问答篇:如何用SuperMemo来学习一门编程语言
  • SuperMemo UX问答篇:巩固练习中的评分并不影响学习进度
  • SuperMemo UX问答篇:随时修改课程内容
  • 来顶一下
    返回首页
    返回首页

     分享: 分享到QQ空间 转贴到开心网 分享到校内网 添加到百度搜藏 Sina ViVi 添加Google书签 Yahoo收藏 添加到鲜果 转发到新浪微博 我要评论】【进入论坛】【社区空间
    发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表
    关于我们 | 诚聘英才 | 友情链接 | 联系我们 | 意见反馈 | 网站地图 | 版权申明 |
    舍得学苑 备案号:冀ICP备11024081号-1
    Copyright © 2009-2015 eMagic.org.cn, All rights reserved.