当前市场上计算机校对软件种类繁多,既有文字处理软件自带的简单校对模块,也有功能更为强大的专业校对软件。目前的校对软件,是以主要由人工维护的字词库或语法库为依托,通过软件进行比对识别,查找错误并给出修正建议。
当前校对软件存在的不足
虽然主流校对软件在产品宣传中都宣称应用了人工智能技术,但笔者实际使用过程中的效果感受并不明显,例如字、词校对结果中并没有将一些常见的误报滤去,整句校对能力依然十分薄弱,数据库的更新仍主要依赖于人工维护而使时效性显得不足。现阶段校对软件普遍存在的不足之处主要有以上五点:
整体报错率高。由于校对软件对错误的检查主要是基于自身数据库对待校文稿内容的比对实现,对发现的不一致之处缺乏进一步核验机制,误报的情况比较普遍。随着软件自身数据库规模的不断升级,误报率往往随之上升。有人根据经验评估,初次使用“黑马校对”时报红(软件认为肯定存在错误的)准确率在50%上下,报粉(软件认为疑似存在错误的)准确率在15%上下;经过手工添加针对性的专业字库并添加常用词维护后,报红准确率在70%上下,报粉准确率在20%上下。[1]鉴于此,大多数出版社在实际工作中都是人工校对后辅以软件校对。
对整句的纠错能力较差。软件一般只能简单地比对字词库,在语义层面并不能具体问题具体分析。比如在一篇关于资产减值方面的文章中,作者用五笔打字连续输入时,某一处“计提的差值准备不低于监管标准”,其中的“差值”应为“减值”,但校对软件无法根据上下文提示这一错误。又如,对于用拼音输入法输入的“曹操亲统大军与六倍的军队交锋”,“六倍”为“刘备”之误,校对软件同样没有任何错误提示。而类似的输入法错误在稿件中会经常遇到。
对古籍的校对能力不足。由于古籍中文言文用字较少、语法结构复杂,且涉及通假字等情况,目前的校对软件基本无法有效识别文稿中存在的错误。
对科技名词(即专业术语)的纠错能力弱。科技名词是汉语词汇中比较特殊的、专业性很强的一部分词汇,由于一般由西文翻译而来, 经常出现同一概念在同一书稿中有不同叫法的情况。“黑马校对”对科技名词几乎无能为力;“方寸”有一定的术语识别能力,但仍十分薄弱。
对图表、公式及版式的校对能力弱。目前校对软件对图表、公式等的校对仅停留在文本层面,而对于其他常见问题诸如图文不符、图(表)序错误、图表设计不合理,以及图表或各级标题的版式等方面基本上只能依赖人工校对。
“人工智能+校对”的能与不能
人工智能(artificial intelligence,AI)的应用领域十分广泛。在新闻出版领域,人工智能在写作、组稿等方面已有所尝试,如腾讯的Dreamwriter、华盛顿邮报的Heliograf等[2]。校对是新闻出版领域中的一项基础性工作,本身具有相对客观化、规范化的特点,较之写作或组稿等工作更易于人工智能技术的实施。
人工智能有望实现的功能:
提高字、词校对的准确性。字、词校对是校对软件的基本能力,但目前其突出问题是错误识别率高的同时问题报错率也高,因而校对的结果仍需人工进行大量复核确认工作,使用价值大打折扣。校对软件有望借助人工智能技术对已出版的规范文献或图书内容进行训练学习,以及对校样文本进行语义识别,自主对校样进行审核和纠错,将报错率降至可接受的水平。
提高整句校对质量。目前的校对软件在文稿的整句校对层面较为薄弱,人工智能在语言处理方面的积累和进步有望在这一方面提升校对质量。借助人工智能,可通过对文稿内容的解析以及对已出版的规范文献或图书内容的对比,评估待校语句可能存在的语义错误并给出可靠提示。
提高校对结果的时效性。以“黑马校对”单机版软件为例,其内含79个专业词库、8 000万条海量词汇。人工智能技术介入后,有望在数据库更新时实现批量读取和分析,及时淘汰过期或错误的数据库内容,这对于一些时效性较强的政策语、流行语、新科技术语等的校对工作非常有帮助。
提高科技名词的校对能力。通过将全国科学技术名词审定委员会公布的科技名词实时纳入数据库,并通过语义分析评判文稿中名词使用的合理性,从而给出准确的校对结果。
具备古籍校对能力。人工智能有望发挥其在大数据训练方面的优势,通过对大量规范化处理后的古代文献的解析,在语义层面更好地理解文言文的语法结构和表达方式,弥补当前软件在古籍校对方面的短板。
人工智能短期内无法实现的功能:
无法校对图表、公式等非文本内容。一些专业图书或文献中会出现较多的图表、公式,这些内容由于格式没有统一的标准,也缺乏足够数量的可比较样本,无论是传统的校对软件还是人工智能软件对此都无能为力,即使是可见的将来也仍然需要靠人工进行有效的校对。
无法校对常识。文稿中涉及的诸多常识,如历史朝代、国家毗邻关系、人物生平等,在我们看起来非常简单,但机器处理起来却异常困难。目前的基于深度学习的人工智能技术,对此并无良策。
无法校对逻辑性错误。目前的人工智能技术在跨领域推理和抽象能力方面还不成熟,对于文稿中可能存在的如叙事先后、因果、并列不当等逻辑关系的错误,基本上无法识别。
面对人工智能,编校人员怎么做?
在当前人工智能的技术条件下,充分利用机器在基础工作中的高效率和人工在创造性领域的独有优势,走人机协作道路,是兼顾编校工作效率和质量的现实选择。
在人机协作趋势下,编校人员应注意从以下几方面提高自身职业能力:
熟悉机器的特点,做到扬长避短。就传统的校对软件而言,字、词的校对是强项,整句、语义的校对是弱项;就未来的校对软件而言,在字、词的校对上功能可能会更加强大,对整句、语义的校对也有可能取得突破,但对于常识、逻辑关系等的校对依然会是弱项。编校人员在使用软件的过程中,可以结合具体的文稿,摸清机器校对的长处和短处,合理安排工作重点和软件使用的时机,以人机互补的方式提高工作效率和工作质量。
关注前沿科技,更新自身知识结构。科学技术的更新迭代,可能让人类引以为傲的传统工作能力瞬间失去市场价值,例如计算器取代算盘,自动驾驶未来极有可能取代驾驶员等。在校对领域,新技术的出现也会使得一些过去积累的经验或技能失去价值。编校人员在平时的工作中可以适当关注科技热点,通过使用最新版本的校对软件等方式了解新技术的特点,及时淘汰过时的工作方式,更新自身知识结构,以此来适应新环境下的工作要求。
增强自身工作创造性,积累有价值的工作经验。就目前的人工智能技术而言,它的能力边界不是无限的。在可见的未来,人类的创造性工作仍然是机器无法取代的。编校人员在日常的工作实践及学习中积累的特定领域的常识、文本规范、语言逻辑等方面的知识,是机器难以掌握和取代的,也是编校人员价值的最有力体现。编校人员可以在日常工作中注重对此类创造性工作能力的培养和提升,打造专属于人类自身的价值。
2024-11-20
2024-11-19
2024-11-18