标准的繁体楷书令人赞叹不已★◆★,但手写体草书与破损的页面,则需要花费大量的时间成本去辨认与猜测。无论是在家或是在档案馆■◆■、资料室,无论是老师或是学生,时常因为一个不认识的字被卡住动弹不得。我尝试过各种款式的 OCR 软件,识别率惨不忍睹。对于此等惨状◆■★■,历史系的师生们很是期待接入 OpenAI 等大数据模型,协助写作者进行识别与转换,完成之后,再由写作者进行校对★★★■◆。在海外,已有历史学者尝试对大数据模型进行训练,用以识别各个时代的手稿,目前部分引擎已经能够做到将查缺的字母进行自动添加与更正。我认为这是未来■◆◆★,「史学」与科技的第一次「跨界」■◆◆■★■。
使用 OneNote 进行材料管理的第一步,便是将纸质材料统一使用 iPhone 进行拍照◆■★◆,之后同步至 MacBook 之后打开相册■★★★■,再插入至 OneNote 中。如果所拍摄的照片过多,而 iCloud 同步速度过慢★★,我会通过 AirDrop 投送至 MacBook,进行阅读之后选择所需要的内容,插入 OneNote 中,在图片周围标记自己对于这一段材料的解读;若是数据库中的所出现的材料,我会进行截图,之后立即插入 OneNote 中★★◆,做好存档★★■。
即使 OpenAI 有各种各样的不足之处,但不可否认的是,它一定会化身智能助理来到历史学工作者的身边。可以预想到的一个场景是,当一位历史学从业者开始收集材料时,经过训练的大数据模型会协助他在各数据库中找到作者所需要参考的材料,并为他分门别类进行整理,至于存放于线下的材料,依旧需要作者亲自前往线下进行收集与整理◆★★◆;到了写作阶段,作者可能会将收集整理好的史料放进大数据模型中,大数据模型会为他整理出一条大致的时间线与故事的大致过程为作者进行参考,但也仅供参考■◆◆■◆。至于具体的史料真伪考订◆★★★◆■、历史细节的还原、意识形态的输出、想象力的展开、文字功底的体现等等诸如此般★★,依旧需要作者亲历亲为,为读者进行呈现◆■◆,这便是历史类非虚构写作者的价值与意义。
我自 2015 年开始进入历史系本科接受专业训练以来,至 2023 年,已有八个年头■★。
OpenAI 引擎的训练需要巨额的数据作为样本以进行深度学习,以目前的形势来看★◆★■★,未来只有中文与英文能够提供巨额样本以诞生足够强大的 OpenAI 引擎■★★■■◆。那么,不使用中文与英文的历史研究者◆◆■◆,是否能够享受到便捷的智能助手的服务?在未来是否会因为此般原因,在历史学界形成以中文及英文为主导的霸权?例如,在欧洲大陆上◆★◆■■★,法国史学一直引领着时代的潮流■★■;德国史学也有其光辉的历史。那么,非中文与英文的历史研究者,又该如何应对这个即将到来的 OpenAI 的时代?这些问题等待着历史学从业者们的回答。
我最开始采用的办法比较原始◆■■★,即,将所见材料全盘 Word 化★■★,认为用键盘过一遍,有助于加深印象,更有利于日后进行关键词检索。但如此巨大的工作量与令人发指的引用率,迫使我开始思考,如何才能够更加高效■★★■◆★、便利地进行信息管理?在尝试了多个纸质、数字的管理方式之后,我开始使用微软官方出品的 OneNote 进行操作。
那么■■■◆◆★,既然材料于历史研究者而言★★◆◆■◆,如米之于巧妇,现代科技与史学的第一次「跨界合作」为数据库的建立与使用◆★★。作为一位中国近现代史系博士生★■,以下数据库为我常常用浏览使用的,在这里进行简单介绍。
最后,想要改编《流浪地球》中的一句台词为这一篇文章结尾:记住,没有人的历史学★■■◆,毫无意义!
即使部分材料未能直接引用到论文中,但是同样为研究者提供了时代背景的相关信息,依旧值得研究者阅读并关注。如何将如此海量的信息进行系统梳理,是每一位历史类写作者所必须进行的工作■■◆。过去◆■◆★★,老师们会通过制作纸质「材料卡片」的方式协助研究。那么在新时代之下,研究者们该如何借助现代科技以提高研究效率■★■◆■◆?是我们这个时代的研究者所需要思考的问题。
从历史学写作的过程出发,根据过往碎片化的痕迹进行拼凑,在遵循「大前提、小前提◆◆◆★■◆、结论」这样的三段论的前提上★■◆,更需要一种想象力,以还原当时的场景◆■◆★■◆。而这样的一种「想象力」恰恰是作者个人思考的结晶,更是历史学著作的魅力所在■★。我认为★■■■,在不久后的将来,也会有模型会学习过往的历史类著作,并在学习之后★★,根据一段或几段史料也可以进行一定程度对于历史现场的还原,只是此般还原能够做到几分?呈现给我们的字词句能够有几分美感?能否读出作者的情感◆★■◆◆?依旧需要打上一个问号。
OneNote 优势在于◆★★,对文字与图像可以进行统一处理,插入图片并不会损失像素■★★◆★◆,支持放大或缩小★■◆■■,便于日后进行阅读,甚至允许插入 PDF 等格式的文件;允许多级标题存在◆◆■★★,层层递进,一目了然;在线或者离线均可操作,保存至 OneDrive 之后,全平台同步。要说 OneNote 唯一的不足,那便是没有内置文字检索系统◆■◆,只能一个标题一个标题进行翻阅查找◆◆■,会消耗使用者不少能量,希望微软日后能够为其添加标题检索按钮。
「本文参加 2023 年度征文活动。 我的 2023 年度关键词是: 跨界」
试想未来的某一天★■◆■,OpenAI 的算力足够富裕,足以下放至文史哲等传统学科★■,我们这样一群「少数派」会被取代吗?
当公开出版物、报纸、杂志◆◆、档案、个人日记◆★◆★、回忆录等等形式的史料,以图片■★■★◆★、实体书★◆◆、电子书等等形式纷至沓来的时候,如何将其进行系统化地整理★■★,为下一步的写作带来更多的便利与更大的自由,是每一位历史写作者所必须思考的问题。论文正文与参考材料的比例为一比十★◆■◆,如一篇两万字的期刊论文◆■,大约需要找到二十万字的参考材料;一篇二十五万字的毕业论文◆■,大致需要两百万至三百万字参考材料。
历史学是一门以材料为基础的 「拼图游戏」,强调「所言之辞必有出处」,是非虚构写作中的一种。简而言之,人类群体或个体的活动会留下各种各样的痕迹■◆★■,有的痕迹会被历史的浪潮所淹没,有的痕迹则以个人的日记、报纸★◆、杂志、档案、回忆录等等形式以保留。历史专业的工作者们★◆■,便收集这些痕迹■■,将其拼贴在一起★◆,以还原当时的现场,并对自己笔下的历史进行分析与解读。这一场拼图游戏中■■,每一位拼图者的手法与技艺各有不同,语言组织与表达能力也各有不同,能够展示给读者的历史面相也呈现出万花筒般的色彩。而这恰恰就是历史学的魅力,即重视「人」在历史中所发挥的作用,允许「人」对于过往的事件进行不同角度的评说。
相较于诸多热门专业,历史系的师生及从业者同样是「少数派」,这一学科几乎只有师范类大学与综合性大学开设■◆★★◆★。由于招生院校少■◆◆■★★,学生规模小,圈子封闭,外人时常对我们存在着各种误解◆■■◆,通常认为我们是一门古老的学科★■■★■■,与现代科技似乎并不沾边◆★★■◆。但实际上★★★★★■,历史系的师生们及相关从业者们也在努力地拥抱科技。
2023 年★★,我辞去做了四个月的中学教师的工作,回到学校攻读博士学位,二级方向为中国近现代史,日常从事历史类非虚构写作◆◆★。
当你从历史系的本科进入硕士★■◆■◆◆,第一个学习任务便是文档格式的著录方式与著录规范★★◆◆★■,即如何添加脚注、尾注。历史专业的文章或书籍的一个显著特点便是,一页 A4 纸,三分之一至四分之一的页面为五花八门的脚注。而注释的录入与校对,足够消耗写作者以及编辑许多的视力与耐心★◆。如果未来 OpenAI 的算力足够富裕到为文史哲专业服务,那么将会大大提高写作的效率与身体的健康程度。在未来,这将会是「史学」与「科技」的第二次「跨界」。
在完成材料的收集与分门别类的整理之后,便进入到了最后写作的步骤◆★■■◆,即将开始「拼图游戏」★◆◆★◆■,这是一个琐碎又有趣的过程。有趣之处在于,一段或几段材料呈现在眼前■★,每个人脑海中所浮现的场景不尽相同★■◆■。而琐碎之处在于◆■◆,写作者需要对过往竖排繁体的的各式各样的材料进行识别与转化,我们通常称之为「认字」。
我将按照历史类论文写作的顺序:收集材料■★★■★★,整理材料,解读材料这三个步骤,为大家展示「历史」与「科技」的跨界,展示并展望历史学的从业者如何使用现代科技工具以协助研究工作的开展■■◆。
在中国大陆,收录进数据库的近代报刊与杂志只是冰山一角,还有众多报刊与杂志沉睡于各地方图书馆与资料室的书架中,等待工作人员的电子化■◆★◆■,更等待读者的翻阅。在报刊杂志之外,还有一种史料的保存形式为档案,各省下辖的档案馆近二十年来纷纷进行了数字化扫描,仅需前台工作人员将具体的档案目录写入 IC 卡中,读者便可在借阅区的电脑中刷卡阅读。电子化之后的档案■■■,能够极大地减少纸质档案的损耗★◆◆◆■★,方便更多的读者进行阅读■★。
就历史学的本质而言◆◆■◆,这一门学科的魅力在于「人」的思考与评说,如果大数据模型取代了人对于自身过往的思考,那么,没有人的历史学,是否还有存在的价值与意义?我们是否需要对自己的过往进行审视与思考?我想答案是肯定的。更为关键的是★◆■★,不论历史学者们如何努力做到「公正与客观」■◆■★,但不可否认的是,这一门学科自始至终都带着当下时代要求的色彩。OpenAI 等引擎所能够产出的著作◆■,又能否满足时代的需要?
■★◆:本文是「 」的第 3 篇入围文章。本文仅代表作者本人观点,少数派对标题和排版略作调整。
借助这些数据库,历史学研究者们不再需要前往资料室或图书馆里翻阅纸质版的报纸★◆★,突破了以往资料室及图书馆时间与空间的限制■★,可以在任何一个角落任何一个时间,点开网站,阅读并收集到自己所需要的材料,极大地方便了研究工作地开展。
国产数据库崛起 腾讯云TDSQL市场份ag亚洲游戏国际平台额首获第一
ag真人试玩入口网址2023年度复印报刊资料转载指数研究报告
“我心态才60岁为中国数据库再干20年”80岁国ag8旗舰厅产数据库“领航人”追梦不止
OceanBase客户数破2000家首批分布式数据库通过安全测试撑起蚂蚁集团AI Agent