传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 3266|回复: 2
打印 上一主题 下一主题

[转载] 文科学术研究常用工具软件及技巧

[复制链接]
跳转到指定楼层
楼主
发表于 2013-6-22 21:45:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
分享
[转载] 文科学术研究常用工具软件及技巧来源:
刘胜军的日志
经过了半年多的废寝忘食,博士论文终于按期杀青,写作过程中很重要的一个感受就是“工欲善其事,必先利其器”。不知道其他同学们的情况,就我个人来说,从很早就开始尝试着将主要的工作阵地转向电脑而非纸质材料,大量的资料和笔记都是电子版的,这不仅仅是因为电子资料便宜,可以省钱(重要的书籍我都会去买纸质的),主要还是因为可以极大地提高效率。也会有一些朋友跟我说他们更加习惯于读纸质的书和手写笔记,我想个人习惯通过练习总是可以慢慢扭转的,而一天读书的时间最多也就十几个小时,无容更改。人生苦短,我们大部分人都没有过目不忘之才,也早过了博闻强记的年龄,经典固然还是要努力去诵读记忆,许多重要文本抄写之后理解和印象都会更加深刻,这我都不否认,但更多的需要阅读的书籍材料只能通过笔记的方式去记录整理,并且能够在需要的时候迅速快捷地找到相应地笔记,相关原文的出处页码,这些时间还是应当通过一些工具软件的帮助尽可能地节省下来。
我最早做笔记是用本子做摘要,也附加自己的心得,后来发现想找需要的材料很困难,首先,做笔记的时候只能就一本书去做,书与书的价值差别很大,有的书一本读下来也没有多少值得摘抄之处,有的书异常丰富,一个本子都用完也未必够,这样就会造成做的笔记很难清晰地建立起一个规整易览的秩序,有的笔记本记了乱七八糟好多书,有的本子大半都是一本书,剩下的空白部分陷入鸡肋。另一方面,写文章往往追随着问题的引领,而不可能局限于某几本书,往往翻本子找笔记的工夫还不如直接去翻原书更快。后来我改用读书卡片,可能是我缺乏足够的分类管理家务的能力,或者是没有受过这方面的熏陶训练,具体细节就不说了,总之,最后抄了许多卡片却难以建立起清晰明了的索引。我很佩服,也很好奇老一辈学人的卡片是如何分类管理的,但不得不承认,我的确没有这个本领。
这些失败的探索之后,我开始在电脑上开始新的数据库建立工作,具体历程就不说了,只把迄今为止的心得拿出来一项项与大家分享,文中有许多你可能早已知道,那就请忽略。文中肯定还有许多不当之处,也希望高人能够不吝指点。

电子资料最大的危险是因为故障而丢失,先说备份问题。
资料库至少应该放在三个篮子里面:第一,优盘或者移动硬盘大家都知道,只要手勤一点儿就行了,值得说的一点是如果你的优盘足够大,每次备份的时候最好不要覆盖上次的备份文件,而是让windows自动改名编号,也许有一天会用得着更早的版本的。第二,笔记本软件(后面详说)有自动云端备份能力。第三,还要再用一个自动在云端备份文件夹的快盘软件,现在这样的软件很多,但我只推荐一个:金山快盘。因为它有一个功能是独一无二的,就是能够保存最近两个星期或者最近二十次左右的修改记录,这意味着,你随时可以找回误删、误改的原始资料。譬如说头天晚上我一时冲动,把论文中写好的一大段删掉了,今天早晨回想起来后悔不已,没关系,在云端可以找回你之前修改过的十几个原始版本。所以毫不夸张地说,这个功能秒杀其他一切快盘。什么流量、空间都无关紧要,我们最重要的文件大小绝不可能超过八个G。至于快盘的使用方法很简单,装好就会用,值得一提的是要设定好自动同步的时间,我一般设为五分钟一次,你当然也可以设为只要有任何修改就自动同步,不过一则不必要,二则可能有时候会造成文件冲突。还有,最好在关机前确定快盘已经同步完毕,否则也可能会造成冲突。

下一个问题是电子书的阅读。
先说泛泛读,也就是无需作任何笔记的纯粹快速阅读,在我的专业(中国哲学)而言,正史,杂史,外国小说,古人笔记等等都算是泛读了,而且平时时间紧,多是“三上”之时,手机算是最好的方式,因为手机最适合阅读的还是txt和chm文件,而二十四史,大部分小说都可以找到这两种格式。
然后是泛读,这主要是涉及学术但又非特别艰深的著作随笔,以及一些要熟悉的重要文本,譬如钱穆先生的许多著作皆可入此列,学生没钱就先读电子版,不用电脑读的话,kindle和ipad代表了现在的两大类型,对两者孰优孰劣的争执网上有许多了,我想说的是,如果读横排书,kindle6寸版足够了,而且小巧方便便宜,但要读竖排书,ipad还是更胜一筹,原因很简单,竖排书必须要有大屏幕,不然不是字小的看不清,就是上下拖动累死,kindle9.7寸固然也能胜任,但既然价格差不多,那还不如买个ipad,至少屏幕不容易坏。有人说ipad功能太多,容易分神,这个就属于“风动幡动还是仁者心动”的问题了。ipad还有个好处,就是可以安装笔记软件,需要的时候还可以随时做笔记。
在电脑上读书很多人可能不适应,其实如果你努力去习惯它的话最终会发现可以节省大量时间。我就以最主流的格式pdf为例来说明,因为其他所有格式原则上来说都可以转化为pdf,最简便的方式是虚拟打印机转化pdf,至于其他的方式,“国学数典论坛-先利其器”版块有许多方便的小软件可以使用,大家也没必要忙着学习技术贴,需要的时候去下载下来用一次就会了。为什么要主讲pdf呢,因为它是我现有视域内最方便ocr的格式。
所谓ocr,说简单点儿对我们读书人就是一个功能:大部分pdf电子书都是复印机或扫描仪做出来的,它们的原始格式是类似于图片的,在读到需要摘抄的段落句子时,只能比着一个个字打出来,而ocr可以让一本扫描图像格式的电子书转化为可以随时摘抄复制的文本格式。网上现有的ocr工具很多,我推荐的是Adobe Acrobat Pfofessional 8.0(以下简称aap,这个软件要收费,学生嘛就去下个盗版的先用着再说吧)或更高版本(据说Abbyy FineReader也很强大,但我没有仔细研究,试用过一下,感觉与app功能差别不大,既然app我感觉完全够用了,老习惯就没有必要再改了)。许多人读电子书只用Adobe Reader,因为它是免费软件,而且占用内存很小,但我要说的是,如果你需要做笔记摘抄的话,必须用aap。因为它有许多额外的强大功能,而ocr是其中最常用也是最犀利的一项。下面我详细讲解一下这个功能以及相关的实用小技巧。
譬如我现在打算精读《真理与方法》,我手头是有纸版的,但是为了做笔记方便,就去新浪爱问下载这本书的pdf版,下载之后用aap打开,发现它是扫描版,许多重要段落无法直接摘抄复制,于是就在午饭前做了如下操作:文档-ocr文本识别-使用ocr识别文本。注意弹出识别文本对话框的时候要点击编辑选项,然后分别选择:
“简体中文”,这个选项依据你要ocr的文本内容来设定,app提供了几十种语言选项,竖排繁体的书也可以ocr。
“可搜索的图像(精确)”,这个选项是为了防止ocr之后文本大小急剧膨胀,选上之后大约比原文本体积增加百分之三十左右。
“对图像缩减像素采样”,这个选项自己斟酌,选择太高会造成文本体积的增加,太低会造成像素质量下降,影响ocr识别的正确率。
选择“所有页面”,然后点击确定之后,如果你的机器不是特别牛的话,最要就不要碰电脑了,放下鼠标去吃饭,吃完饭回来它就ocr好了(据说9.0速度提高很多,我用的还是8.0,没有做过测试),点击保存就可以了。
这个时候这本书就变成了一本双层书,也就是说,在阅读的时候你看到的还是扫描图像,但是图像下面还有一层隐形的ocr转换出的文本,现在你在阅读的时候看到那段话重要,就可以直接用鼠标复制粘贴了。比如这样:
但是这样粘贴出来的是许多行的文本,而不是一段,要一句句地调整格式很麻烦,这就需要用到另一个绿色小工具:文本处理器,或曰textpro。可以看到粘贴上的初始文本是这样的:
然后点击一下“删除段内回车”按钮就变成这样了:
如果要求格式比较正式,就还要再点击“半角转全角”按钮,把标点符号也转换一下,繁体字也可以直接转化为简体,还有许多其他方便快捷的功能,这里只是说说最常用的,其他的大家可以根据自己需要去研究。
此外,还要顺便说一点电子书相比起纸质书的优点,就是它可以随时加入书签和批注,不要小瞧这个功能,如果你试过在纸质书上加书签你就会明白这是个很麻烦的工作,假设说我现在读一本书的时候有一个始终在关心的问题域,而这本书本身也很重要并且有其自身的问题结构,那么我在读书的时候就需要同时有两套分类法。我们从两方面来说,先说书本身的结构,你可以说书本身的结构在书的目录中已经有了,但是大部分电子书的页码和文本页码并不能严格对应,这就需要我们在读书的时候手勤快点儿,边读边作pdf目录。这个目录应当包括目录页、版权页和章节。再说依照自己的问题域做的笔记,这就更加需要你的勤快,在读每一节的时候都随时以更下一级分级目录的方式建立起各种关键词索引,有时候即便你自己的问题域不是很清楚,也可以在阅读的时候随手记下来。譬如说,朱伯崑先生《易学哲学史》中每一节都非常长,涉及的问题很多,有时需要查找某个论述的时候比较困难,就可以在读的时候这样随手做好目录,等到将来有一天你在写论文的需要查找这本书中某个问题的时候,你会非常惊喜地发现,当初自己勤快地随时动手得到了回报,自己现在几秒钟内即可定位到重要原文:
而纸质书这样做就比较困难,我曾经试过用那种带黏性的小便条来做这个工作,不仅把书弄得像个疯女人,而且在找某些关键问题或者关键词的时候,纸条上的字需要逐个辨认,在一目了然性上比起电子书差了许多。顺便说一句,如果是ocr过的电子书,还可以使用查找功能,但我一般不会对此抱太高期望,因为第一,从现有ocr技术来说,错别字还是很多的,所以在引用文本的时候必须校对一遍,想直接查找往往徒劳无功。第二,即便精准无误,想依靠直接搜索来找到自己需要的某页论述也是非常困难的事情。所以我还是一再强调,读书的时候手勤快一点是最重要的。
接下来再说做笔记,我曾经用过数个笔记软件,最后选定了为知笔记,大概有如下几个原因:其一,为知笔记面向用户是知识管理类型,虽然不像笔记软件的老大——印象笔记有那么多强大多媒体功能,但是对于单纯的知识管理完全足够了,而且界面会更加简洁。其二,为知笔记给免费用户的每月流量完全够用,即便你认为不够想升级为付费用户,一年也只需要几十块钱,我想对任何人即便是穷学生而言这都不是一个很大的负担,除此之外,如果你邀请朋友加入的话,可以得到积分换取vip。虽然我目前还没有发现免费用户与付费用户有多大差别,但本着支持软件的精神我还是愿意付费。而印象笔记就昂贵得多,大概一个月就要几十块钱吧。其三,也是最重要的一点,至少到目前为止,为知笔记可以无限制地建立下级文件夹目录,而其他的笔记软件最多只能建立三级。我不知道开发笔记的软件商是怎么想的,这应当是一个非常容易调整的小程序设定,但对我而言他非常重要。因为做笔记的时候你永远都会遇到新的难以分类的资料,或者将你现有分类更加细化的问题出现,对于平时工作日程管理之类的也许三级目录足够了,但是对于学术资料的整理,三级目录是远远不够的。此外,为知笔记也有一些很方便的功能,比如google日历同步插件之类的,但对我而言,最主要的使用还是做笔记。再补充一个可能对大家都已经是常识的事情,现有的笔记软件都是可以自动在线同步的,也就是说你的资料数据不仅存在你的电脑上,它也保存在云端服务器上,所以不必担心电脑出现故障造成资料丢失。当然,有可能你操作中会有误删误改的情况发生,如果你担心这个,那么就用你的金山快盘把为知笔记的资料保存文件夹也设定为自动同步,这样,你可以随时找回一个星期之内的资料修改记录。此外,为知笔记也具有现在所有笔记软件的一个共同特点,多平台同步功能。也就是说你也可以随时在另一台电脑上,你的ipad上或者你的手机上调阅修改增删你的笔记资料。个人感觉为知笔记的移动客户端做的不如印象笔记好,但因为我主要是在电脑上工作,用其他客户端一般仅止于查阅功能,譬如睡前躺在床上用手机翻一下今天的读书笔记,所以也就不求全责备了。
最后说一下用软件做笔记的一些个人心得。我们可以把要读的书按照重要级别大致分为几类:
【I】并非你专业研究方向,也不属于重要经典,这类书只需要泛读,在阅读的大部分过程中无需做笔记,偶尔有一些要点或者触发思路闪光之处需要记录。那么第一,在这样的闪光之处要加上目录书签(以便将来需要时可以迅速定位);第二,在你的笔记中新建一条笔记,此笔记的名字可以用书名命名,最好顺手再把此书的版权信息放在此笔记的开端(将来如果需要写文章的时候可以直接就把注释做好)。第三,将这段话或者某句话复制下来,然后在笔记中打出“1”并加上一个你总结的简洁关键的词或句子,然后另起一段把复制信息粘贴进来并进行简要点评记录,而且记录下原文的页码(编号和摘要是为了回头巡检的时候能够清晰迅速的找到相关问题,页码还是为了写文章方便注释)。第四,于此同时,如果这段材料与你曾经思考过的某个重要问题相关,不要怕麻烦,找到那条笔记——如果你的分类足够清晰,这只需要几秒钟——并且将这段信息也照样复制到那条笔记中去(我们不仅需要按照所读之书建立目录资料库,还一定要按照自己的问题域来建库,使之构成纵横交错的网络,在这个时候你如果肯多点几下鼠标,再按一下ctrl+v,只需要几秒钟,但在将来它可能节省你大量时间甚至触发你意想不到的许多思路灵感)。第五,当发现下一个闪光点的时候,重复第三点,并继续增加你的数字编号。
【II】重要经典著作,譬如西学中的柏拉图,亚里士多德,笛卡尔,康德,黑格尔等
...


分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对
沙发
 楼主| 发表于 2013-6-22 21:46:08 | 只看该作者

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表