排律·无家

欲作诉衷歌
沉吟句不得
异文形可辨
国语韵难合
暂旅非长所
独行无并辙
梓乡更旧貌
亭迹筑新阁
年少嬉游处
而今剩几何

关于设定,关于核心向

最近Total Eclipse开播,Muv-Luv系列第一次走向大众。ageFansub的群里的各位从各处转来各种不明真相群众的批评,颇为感慨,所以来闲扯两句。

争论的一个焦点是与BETA作战的方式。人形的战术机被吐槽自然不会漏过,然后是关于运用现实世界各种武器,关于运用Gundam等系列作品中的武器,包括不只一个人说“当然用战斗机更好啊”。短短的两集动画,很多必要的设定都没机会展现;而这些群众,大多也显然未读过原著系列的任何一部。当然,并不是说某吉的技术设定无可挑剔,但是至少他基本上能自圆其说,没有严重的矛盾。

我一直觉得,任何脱离/超越现实的设定,都不可能完美无缺。想挑毛病的话,总是会有的。此外,如果把设定和设定中未涉及的现实世界常识结合,也很容易挑出毛病来。但是这又怎样呢?能进一步完善设定吗?未必。而且,现实世界的常识,没有保证在这个设定的世界里也适用。设定中已经出现了现实世界没有甚至不可能有的东西(Muv-Luv系列中就如BETA的繁殖力和光线级的功率/精度),凭什么认定设定没有提及的方面就和我们身处的世界一致呢?就好像除去第五公设的Euclid体系,配合第五公设可以发展出一套几何;配合Riemann或者Lobachevsky的假设,也可以各自发展出一套几何。从我个人的偏好来说,我不在乎设定未提及(或许就是故意回避)的部分是否和我们的世界一致,只关心设定是否覆盖了足够的范围,是否自圆其说,以及是否给角色们展现人性提供了合适的舞台。

另一个问题,就是很多人其实根本还不知道是怎么回事就口气很大地站出来评论,然后评论的内容其实是错的或者多年前就有官方解释。诚然,Muv-Luv系列的设定很庞大厚重,其实我也只看了主要部分,还有大量的细节不清楚。MLA的设定集300多页,其中包括大量文字说明。这也导致了该系列作品严重的核心倾向。倾心于厚重的设定和人性刻画,一部分人成了age社的死忠,多年来也成为age的支柱。但是这部分人很少,大众并不知道这个以鬱著称、触及一些敏感话题的galgame/visual novel系列,或是望而却步了。这次age做TE的动画,也是力图把作品推向大众的尝试,选取的TE也是系列中最容易被大众接受的一部外传(我tm要正传的动画化!!)。然而,看起来,这仍然是一项困难的工作。对习惯了后宫、英雄、神棍机师的动画观众主体来讲,一个带有浓重绝望色彩的严肃故事(虽然也卖萌了吧)并不讨人喜欢。

当初群里也有人预测,这东西出来必然被各种无脑小白骂。这样核心向的东西,或许还是停留在喜欢它的少数人群里更好。当然这对age的财政来说不是个好消息。当然,骂就骂吧,无关我们痛痒。相比之下,我倒更害怕在现实中跟这样的人共事。不懂装懂,还把话说很满的人,往往成事不足败事有余。

八年,变了很多

昨夜又通宵翻片了。夜里1:35电视台开播,两点多点拿到片源开翻,五点多翻完睡觉。上周是两人分工各翻一半,这周就是我自个儿翻了。到这把年纪,通宵实在有点痛苦了——不是大二时能连着写代码从一个早上到下一个早上,然后倒头就能睡的年纪了。过了八年,精力已经进入下降期了。

其实不是为了说这个八年,真正的主题是最近很感慨:我tm也终于成为翻字幕的人了。03年底偶然看到一篇讲Macross系列的文章(回想下当时正是Macross 20周年),然后去找出初代Macross看。这大约可以算作我看日本动画的开端。小时候零零散散看过一些,后来也看过一点宫崎骏。不过第一部让我有“日本动画”感觉的,是Macross;也是从Macross之后,我开始大量看动画。那时还彻底不会日语,字幕是不可缺少的。回想起来那时字幕组还少,翻译质量也普遍较低,真是一段不容易的日子。渐渐地开始挑剔字幕组;渐渐地又开始不挑字幕组。到现在,我也从刚接触动画,成长为可以拿着raw做主翻的人了。

这次翻的Total Eclipse,同时是另一个八年的界标。04年初,我看到了君望的动画。那是age社第一部TV动画,也是我第一次接触age作品。时隔八年,age社第二部TV动画上映(age真穷…),而我在一个字幕组里,给这部动画做主翻。八年前,看完动画我就去找来君望的原作游戏,然而连半个假名都不认识的我,面对没有汉化的作品只能遗憾。而现在,我已经读完age社绝大部分公开作品,还开始着手引擎的破解,以求为长年没有进展的汉化开辟道路。

「人生は冒険だ。」面对未曾预料的未来,我曾经惶恐,不过也渐渐开始学着享受其中的乐趣。八年前的我预想不到现在的我,现在的我又何尝能预想八年后的我。

 

流水帐——上半年打的几个galgame的一句话吐槽

上半年虽然在rUGP的事情上投了大把的时间,还是基本保持了每月一作的进度——当然其实这个速度并不快。不过之前关于WA2想写的太多,别的就都耽搁了。在此记个流水帐,攒点充实感。

穢翼のユースティア:制作精致,虎头蛇尾。ユースティア的制作是足够精致的。配役、设定、音乐、画面、包括人物塑造,都是用了心的。只是,后半程剧情走向和最后结局实在是给我一种下楼梯时一脚踩空的感觉。倒不是说不能这样结,只是觉得处理得有些草率了。

マブラヴ オルタネイティヴ Chronicles 03:旧角继续抢戏,恶搞拯救世界。The Day After Episode 02继续01的路线,まりもちゃん继续闪耀,而这次连**(消音)都出来了,各种怀念MLA。剧末白銀都露了一面,这是下一作要强势回归的信号吗?再诞则继承了憧憬的风格,彻底的恶搞和大量的杀必死贯穿始终。搞笑总归是比严肃好写啊,也更有助于读者们的心理健康……话说这一作总算把彩蛋一样的H去掉了,听不到唯依那句“最低”其实挺好的。

装甲悪鬼村正:英雄的时代已经过去,恶鬼的时代已经来临。村正是一部伟大的作品,它的主题是革命性的。锄恶扬善的英雄谭是永恒的主题,但是“正义”这个概念往往经不起推敲。村正强调,善恶是因人而异的,甚至不同人的善恶关系是不相容的。而武力,本质上只是一种无差别的毁灭工具。在杀死恶的同时,也杀死了恶背面的善。因此,武帝以杀戮天下布武,善恶相杀,让人铭记武的本质,而不是陷入名为“正义”的伪善幻想。这是一部神奇的作品,虽然有偏激之处,却是颇有见地的。

魔法使いの夜:前半有点拖沓,后半比较imba。毋庸置疑,这部作品的主题就是歌颂传为蘑菇老婆的蒼崎青子。引擎的效能发挥得很充分,演出很成功,实际读下来也倾向于支持蘑菇不加入语音的决定。后半程的情绪调动很到位,不过草十郎太imba了吧,又不是从猎杀猛犸的石器时代穿越过来的……期待晚些时候的第二部。

鬼哭街:内功宗师大战义体人。没错,老虚这部作品,设定就是这么山寨。战斗描写不错,主题也有点意思。仍然是老虚擅长的模式:传奇的角色、执念带来的异化、充满遗憾的悲剧。这个东西给日本人看大概评价会更好;在中国人看来,有些部分的设定还是太奇葩了。尤其诡异的就是各种命名,其中人名最甚。看看这些名字吧:孔濤羅,孔瑞麗,樟賈寳,斌偉信……

City Hunter / Angel Heart 吐槽和感动

5月底打完魔夜,一时间没力气开工其他作品。忽然心血来潮,去找来City Hunter的动画看。C.H.之名多年前就有耳闻,不过一来太老,二来看了介绍提不起劲,一直没看。去年看了H2、Touch等旧作后,开始感到这些旧作朴素的背后可能有更多值得回味的东西,起码比近年的卖萌卖肉卖腹黑有看头。

C.H.几乎和我同龄:漫画开始连载于85年,第一部TV动画则上映于87年。作为一部Jump当家漫,果然是老少咸宜——也就是更适合哄小孩……这倒不是贬低它:能让大众容易接受,不会因无聊而很快放弃,肯定不能说是一部糟糕的作品。作品基本形式是系列剧,讲的是搭讪狂加无敌枪手的冴羽獠,在搭档槙村香的百吨锤、女警野上冴子的哄骗、前佣兵海坊主的火箭筒伴随下,各种传奇冒险锄恶扬善的故事。人物脸谱化,剧情程式化。不过必须说,还是比某个连载了18年的少年侦探剧良心多了,至少它肯推进也肯结束,而不是一直拿似曾相识的内容继续骗钱……

C.H.的设定介于现实和幻想之间。时代、科技、政治设定中都能嗅到我们这个世界的气息,但是夸张的部分也很多。比如獠的技术太过神奇,可以在战斗中把子弹射进对方枪口;比如主角光环过于耀眼,主角团各种穿梭于枪林弹雨之中而毫发误伤;比如獠超越战斗用全身义体的身体能力;比如獠面对女性内衣时严重到如遭受过催眠暗示的强烈反应。对于它中后期表达的成年人的现实情感来说,这些适合吸引中二少年的部分反而起了削弱的作用。

剧中可以吐槽的地方实在太多。比如獠各种跟武装直升机过不去:被机载机枪扫射,然后用左轮回敬一枪把直升机打下来。这样的段子出现在两季的OP里,以及不只一处剧情里。这是从传说中的金日成步枪打美国飞机得到的灵感么……香则实在是光环强烈:各种失误被各路敌对人员抓去,死过五十次都不奇怪的人,每次都能等到獠的救助,还不带受伤的。另外就是海坊主的ツンデレ:即使在ツンデレ早已烂大街的今天,男版ツンデレ仍然是少见的,做得让人丝毫不觉得反感更是难得…不过,让这样比熊还强壮的大叔比剧中各种女性角色还萌……

Angel Heart是借用了C.H.设定,时间设定在C.H.十年后的一部作品。尽管北条司本人声明不是C.H.的续篇,尽管设定上还是有一些不一致,毕竟主要人物都是从C.H.来的,也不由得大家不把它和C.H.联系起来。于是悲剧发生了:在A.H.一开篇,香就被写死了…然后香的心脏巧合地被移植到了台湾杀手“グラスハート”体内…然后“グラスハート”来到东京做獠的女儿…然后是各种系列剧的亲情故事……

A.H.可以吐槽的地方也很多。比如香虽然只剩在他人体内的心脏,却频繁各种显灵。喂,关二爷也没您这么勤快吧。又比如剧中这帮人时不时说汉语。我听他们的日语毫无障碍,这些个汉语却是死活听不懂……主角光环和各种神技倒是削弱了,不过那百吨锤还是被女儿继承了么……

而出乎意料的是,看A.H.开头部分让我哭得一塌糊涂。这倒是一年多以来头一次。当然,C.H.一百多集长度摆在那儿,积累的亲近感很强烈,是一个很强的因素。不过应该承认北条司充分利用了这个分量很重的便当,调动起了观众的情绪。

总的来说,C.H.是二十多年前的东西,有些模式属于过去的时代;A.H.也没有完全摆脱这些因素。不过,这两部作品确实比现在很多灌水的新番更值得一看。

最后补一句,看了这两部,深刻体会到神谷明大叔也配过这么帅的大叔啊!

附图: Angel Heart

あの丘で

上周末去了横滨一趟,到清水ヶ丘公园看了一眼。这是君望/Muv-Luv系列中某传说的后山的原型地。严格来说,是最接近作品设定氛围的地方。根据君望fanbook的说法,当时各背景图都没有直接按实景画,而是做了改动,严格意义上的原型地其实并不存在。比如某常见的港口公园图,虽然图中的桥和实物一样,但是现实中距离桥这么近的地方没有公园,只有货物码头。

“あの丘”设定是白陵柊高校的后山,特点是有青草有树的山坡,视野开阔能总览柊町(横滨)。虽然不像心跳系列传说之树那样有确切的说法,却是很多关键情节的舞台。君望中如第一章遥的告白,第三章水月的结局等;Muv-Luv中如純夏的结局;Muv-Luv Alternative中如和霞的约定(好吧那不是我们这个世界)。即使到了The Day After,日本已经沉了,还在西雅图设置了一个类似的场景。

从google street view和网上fans的记录来看,位于横滨市南太田站附近的清水ヶ丘公园似乎是和“あの丘”最符合的地方。(君望fanbook给出的举例是野毛山公园,但是山坡的配合度似乎差点。)公园地势较高,西南侧有一个小坡,有草有树,视野开阔。虽然细节上仍有一些对不上,大的要素都凑齐了。下面就是到实地拍到的几张照片。

近期rUGP方面进展的若干备忘

进入六月后搞了三周rUGP,还是有点收获的。一方面搞定了立绘,也做了个粗略的文本提取功能;另一方面开始跟踪调试Nagato的补丁,对钩子怎么做有了个很初步的概念。不过又要开始忙了。老样子,写备忘,收工……

一 关于资源的静态提取

从接触到的几部分材料看,最关键的参考资料还是hikobae的alterdec。RIODecode所做的限于脚本中文本的提取和打包,以及.rio.ici文件的解码和编码;而WESTSIDE社的工具是alterdec的继承和扩展——从字符串看,其中很大一部分可能直接就用的是alterdec的代码。要想完整正确地提取文本,要想提取更多类型的资源,恐怕只能回归hikobae的ReadObject(),乖乖地把一路上遇到的对象都解出来。在RioX上,下一步可以考虑去做的是增加遍历资源树、完整正确提取文本的模式——这也是alterdec原本就具备的功能——不过,想要支持MLA以外的作品仍是一个颇为困难的事情。

最近在想的另一个方向是能否调用rUGP各dll中的函数提取资源。alterdec很伟大,但是相应的算法分析过程还是太艰苦。为了提取资源,我们并不是真的需要确切的算法。能正确找出dll中的函数并正确调用的话,也一样可以提取。当然这两个“正确”是另一个难题,需要不少跟踪调试的努力。而且age社也在不断更新dll,基本每一作出来,dll都和上一作有些不同。总之,现在的我连Olly都不熟,还做不到这些,留作悬案吧。

二 关于Nagato的钩子

最近开始用IDA+Hex-Ray和OllyDbg研究Nagato的mlhookv2.rpo。初步的跟踪发现,该补丁动态修改了rvmm.dll、UnivUI.dll、Vm60.dll和GMfc.dll,替换了14处资源/字符串/代码,并安装了19个inline hook。字符串和代码的替换比较明了,.rsrc段的替换应该也不难查明白,比较麻烦的是那19个钩子。每个钩子都是覆盖10个字节,先把被钩位置所在模块的基地址压栈,再跳转一个远地址到mlhookv2.rpo里,相应处理做完后跳到原址后面某处继续执行。

麻烦的是,这个事情似乎是在汇编层面上做的。一方面,所钩的位置在函数内,跟上下文关系密切,比如有一个就装在push/push/push/call序列的第二个push语句上;另一方面,跳转到的位置不是一般的C函数,更像C/汇编混合编的代码段,栈都不一定平衡。这样一来,要搞明白发生了什么,就得把两边的汇编都看明白。当然,调试mlhookv2相比调试rUGP找函数省事,不过还是需要一些努力。目前暂时就做到这里,后面的工作有空再说吧。

总之收工忙正事去…起码文本替换钩子是要做的,不过也要看时间了…早几年都没摸破解这摊事(毕竟我不是爱好技术的人),现在有兴趣了却没那么闲了……如果把当年花在博得和无冬上的时间拿过来……当然,现在再谈这样的如果什么用都没有……

RioX 1.1完工,及各种杂谈

一周前写文说重开rUGP方面的事情,当时也没想到进展如此之快。到昨晚为止,解决了立绘的提取,实现了粗略提取文本的通用方法,RioX 1.1版的界面也写好了。虽然提取的内容在CG/背景的基础上增加了立绘和文本,毕竟仍是在复现和通用化有人实现过的东西,所以只增加了副版本号。如果有一天搞出了前人没搞出来的东西——说句放卫星的话,搞出视频/音频的话——再叫2.0吧。

首先是文本。前面也说过RIODecode和alterdec的局限性,遗憾的是,我也没能改进太多。我的提取算法类似于RIODecode,在二进制数据中识别字符串然后提取出来。经测试,我的算法可以对应君望DVD版以来的各游戏(君いたFV等早期游戏中脚本未加密,需要跳过一个步骤),但是不保证不错不漏。感觉上每解出一千个字符串,就要有一到两个有问题:或者是二进制数据被误认为字符串,解出没法读的东西;或者是有字符串没解出来。读这些文本了解剧情足够了,要进行翻译等精密工作的话还应该进行进一步的人工校对。

我在文本提取中用的思路是识别shift-JIS编码和利用Vm对象的结构信息,后者基于hikobae的解析结果。shift-JIS编码的识别是个很强的约束,而且age社的文本也有规律,在字符串比较长时(比如多于12字节),识别几乎万无一失。对于长度较短的字符串,就很困难了,需要结合一些结构信息,也没能完全避免错误。不过相比RIODecode,我输出成了一种容易人工校对的形式,这也是个有意义的进步吧。RIODecode的输出文本中结构控制信息太多,不学习下程序的话看不懂,也难以人工修改,甚至程序本身也是靠修改不知所云的输入参数来适应不同的脚本对象。我的输出至少可以让外行也能立即上手吧:输出文本仅包含字符串内容和字符串起始位置tag。误识别的字符串直接删除即可;前后文之间缺东西的话,可以用二进制编辑器去解开的脚本文件里找相应的位置,手工添加一条记录即可。同样地,把这些误判漏判的位置记录到文件里,由程序读取处理也是很容易的。相比RIODecode,这应该是一个对翻译人员来说更方便的解决方案。当然,学习Nagato用钩子+Ctrl可能更好。

文本部分花了三天搞定,没想到接下来的立绘只花了两天。原因很简单:我3月的时候已经走到距离真理很近的地方了。那时我通过对比实例,发现立绘对象开头的位流相当于一个剪影,而现在我发现,边界信息之后的部分和CG/背景图片的提取是相通的,最大的不同无非是立绘中只处理剪影内部的部分。然后就是找立绘对象数据特征即可。能做到这些多亏有WESTSIDE的工具:它让我能确认到一些立绘在rio文件中的位置,从而可以通过比对/猜想找出提取算法。

其实,前面一直拿“CG/背景”和“立绘”描述我解出的图片对象,是很不准确的。只能说相应类型的对象“主要用作CG/背景”和“主要用作立绘”。比如君望DVD版,绝大多数立绘用的就是“CG/背景”用的存储类型;而在较近的游戏中,“立绘”对象用来存储各种差分图像,不仅包括近似CG的差分,还包括一些把立绘分解为身体、头发、眼、嘴等元素再合成的实例。总之,“CG/背景”和“立绘”只是一个简化的描述方式,不过为了方便,今后我还会继续这样描述……

到此为止,RioX已经可以从rio文件中提取绝大多数图片和绝大多数文本。不过两部分都不完美:对比WESTSIDE的工具,还有一小部分图片没有提取;文本也还存在错漏。不过进一步的解析边际效益就太低了,暂时没有投身其中的打算。

作为一个到现在还不具备破解必要技术的新手来说,我觉得做出RioX来还不错了。在整件事中,我所做的整理远多于发现,更多地是在已有信息的基础上合理猜想并加以验证。之所以能把rio2png/alterdec代码中没有的图片解出来,除了WESTSIDE社工具提供的各种线索,更重要的是我有这样一个假设:“从开发者的角度讲,底层的数据流编码应该会保持一致”。而事实证明确实如此:虽然hikobae和WESTSIDE都对不同对象类型区别对待,并写出了很多底层的解码函数,我却成功地把这些函数统一了起来。立绘的成功提取也要归功于此。hikobae和WESTSIDE所做的是正常的破解:跟踪,辨别,然后记录。而我所做的,则是揣测开发的方式,并基于前人已有的结果,提出假设并验证,让有限的信息发挥出更大的作用。当然,我这个方式局限性很大,现在也基本走到头了。

最后,虽然RioX 1.1写出来了,关键的conan同学却不在,暂时没法放到riox.thisillusion.org上面去。不过相关工具已经空白了几年了,也不差这几天吧……

rUGP资源提取工作重开

搞thesis搞了快俩月,上周总算交上去了。休整了几天,重开rUGP这边的事情。虽说是重开,后面还能走多远,自个儿也说不清楚。一方面,容易取得的资料基本上都消化了,却发现前人只解决了一小部分问题;另一方面,摸了下Ollydbg却发现用起来并不容易,我想要自己走更远也很困难。总之闲时摸索着做一点吧。目前的状态是:吸收了alterdec的CG/背景/文本解析算法,吸收了WESTSIDE社部分解CG/背景的算法,并统合了CG/背景解码部分。目前想做的课题:1.通用的文本提取算法;2.较新立绘类型的提取算法;3.替换文本/图片的程序钩子。正在做的是第一项。

实际做起来发现,从.rio文件中提取文本,并没有预想的简单。现在找到的资料只有君望英化项目的RIODecode(强烈感谢blovewind提供资源,连代码都有!),和alterdec中的文本提取部分。Amaterasu的英化版也提取了原始文本,但是据Nagato说用的是钩子+ctrl的方式,而不是从.rio文件中静态提取的。

遗憾的是,RIODecode和alterdec的文本提取方式都不够一般化。RIODecode是君望DVD版的专用文本提取工具(其实还能解.rio.ici文件,但是还没搞明白解出来做什么用),似乎是成功解出了全部文本。该工具只找出了较少的数据规律,解文本的算法比较tricky,需要人为设置5个控制参数。而这些控制参数,甚至对君望DVD版这个专门针对的对象都不是统一的。在全部229个脚本中,用默认参数可以提取的只有194个,另外的35个需要分别设置独自的控制参数。

从原理上讲,RIODecode不需要解析脚本数据中种类繁多的对象,除字符串之外,其他部分都被当作“不明的二进制数据”跳过了。这个方式本身是适合于通用化的。然而,5个人为的控制参数是跳过这些“不明数据”的关键,寻找文本的难度转化成了设置参数的难度。这是一个重大的进步,但是仍然很不好用,连解君望DVD版都有15%的脚本需要单独设置参数。我暂时还没有尝试用调整参数的方式去解其他作品的文本。

alterdec的文本提取针对Muv-Luv Alternative 18X版,方法很优美,但是也有局限。alterdec在解析多种对象的基础上,正确维护了对象类型记录的cache,进而能正确识别对象并跳过不需要的部分。hikobae给出了近300种OM对象的读取方法,做到了在MLA的脚本解析中正确界定每一个局部对象的类型和数据长度,进而完整正确地提取文本。这是一个伟大的工作。

然而这个方法的问题也同样显著。当脚本中出现新的对象类型时,就必须去把这些新的对象类型也解析了,才能保证alterdec的方法可以继续使用。否则对象类型记录的cache可能会漏掉一部分内容并导致对象的识别和界定出错。要保证能够用识别对象的方法提取文本,需要解析相应.rio文件中的大部分数据对象类型(事实上hikobae就是解析了MLA中出现的大部分对象类型);而随着时间推移,age社在不断加入新的对象类型,也在舍弃较旧的对象类型。用alterdec的算法去解MLA之前和之后的作品,都只能解出其中一部分脚本,而且解很新的作品时几乎就解不了含有文字的较长脚本。

RIODecode和alterdec提供了两个思路,然而都不容易通用化。我现在试图做的,就是结合两方面的参考材料,争取靠粗线条地界定VM对象,做一个更通用的解决方案。看起来不容易,能不能做出来全无把握,总之试一试吧。

当然,做文本的静态提取可能不是很必要。搞定钩子的话,完全可以像Nagato那样一路ctrl过去取文本。甚至这样还更便于文本替换——只需要挂上同一个钩子即可。即使从.rio文件中解出了文本,也还存在如何把翻译文本静态或动态地替换回去的问题。

交给外人proofread就是个悲剧

昨天proofread的结果回来,我一下掉到了郁闷的谷底。实在是不吐不快,就开始写这篇文。

作为非英语母语的学生,身处非英语母语的国家,却要写英文的论文,难免各种悲剧。免不了自己写完了回头改两遍,也免不了找英语更地道的伙计们来帮忙看一下。其实实验室同学的proofread还是比较给力的,毕竟对彼此做的东西有个粗略的概念,也知道领域内的术语和习惯说法。我就从中学习了不少东西,尤其是从实验室的Leon同学那里。但是有时交给外面的人proofread,就不免各种悲剧了。

第一次交给外面人proofread,是第一篇journal最终修改的时候。出版社说可以免费找native speaker修改语言方面的问题。我心想那行啊,反正不吃亏。结果却让我大吃一惊。双倍行距(还是更宽?)的校对稿发回来,只见满篇批红。差不多是把我的内容用他的话重写了一遍。修改意见铺天盖地,却没有改好的稿子可用。我只好一点一点对着改原稿,一边感谢人家确实把话说得通顺些了,一边感慨人家错改了若干术语。折腾完回味下发现其中有些说法还是不符合本领域的习惯,但是懒得改回来了。编辑部不在乎;我不在乎;也不是什么牛杂志牛paper,估计读者也不在乎。反正意思没错,就这么着吧。

第二次就是这次。十几天前改完被拒的第二篇journal,炮制好热腾腾的第三篇journal,跟老师问了句说我投出去吧。不知老师怎么心血来潮,说高水平的英文期刊对语言要求很高,投之前找外面的专业人士proofread一下吧。好吧,确实之前投TEVC被拒有语言方面的问题,这次打算投的ALife也是个好杂志,那就校吧。于是乎根据老师的要求,把两篇journal硬接成一部文档(为了便宜…),他找了个地方送了出去。晚了还告诉我:好好利用这个机会,花了15万呢。好吧,还真不便宜。

谁知过了两天,到了交博士论文题目的时候,老师忽然跑过来说:你的publication太少,答辩有危险!靠,前两天说要投论文时您一点不急啊。好吧,为了保底,先把那刚出炉的第三篇投了吧,不等proofread了。于是折腾了几个小时的日文模板(日文latex也是个悲剧),投了某学会论文志。这东西是日本国内搞进化计算的人自己搞的杂志,审起来快,要求不算太高,这个底应该能保上吧。

然后到了昨天,proofread的结果回来了。这15万买回来的产品差点没把我郁闷死。这次真就是把我的内容用他们的话重新写了一遍。不是“差不多”,而是完完全全…就没看见哪个句号前面没有修改的…更头大的是修改的内容。这次投出去前我自己改过一轮,在Leon同学指导下又改过一轮,本身的质量不能算低。专业人士给改的文本,确实有一些话通顺了;但是也有一些话把我的简单句合并成复合句,变得或许更优美但是明显更绕了。这还是好的。有很多地方把我的术语或是领域内习惯的说法改成了不合适甚至不正确的说法;还有不少地方把我原句意思改了,而改变之后的内容是错误的。这还没完。这次人家专业地直接给出了修改后的tex文件。但是改着改着我发现tex文件里有错!人家用word做的校对稿确实没问题,但是修正稿的tex里有的地方没相应地改过来,导致了新的错误。结果我只能自己再细细地查一遍做修改。该会社还敢说“您可以直接提交我们修改好的文档”。这玩意儿要是投出去,一看就是一粗心的外行写的,虽然英文确实native了。

总之到今天为止,第二篇journal改了大约一半,明天争取改完投出去。应该说经过proofread,确实可以提高语言表述。但是这些研究上不专业的专业校对人士,也会带来相当多的问题。尤其现在在赶博士论文的关头,需要花好多时间逐句改paper就是件更郁闷的事情了……