档案之窗-科技档案
点击加入->档案管理交流QQ群(708132784):
科技档案编研加工方法的信息化
2018-12-19  浏览:31

科技档案编研加工方法的信息化

(一)文字录入方法

对传统纸制科技档案信息实行电子编辑,首先要通过录入的方法,将它们变成计算机可以处理的数字信息。具体分为以下方法。

1.键盘录入法

键盘录入法即打字录入的方法。具体操作可采取:

1)纯文字法,即只录入档案的文字内容,除换行、换段外,不加任何控制符号或排版命令的方法。

2)即打即排法,即一边录入文字,一边进行版面编排,融打字排版为一体的方法。

3)混合输入法,既录入文字,同时也在正文之中插入一些排版的注解符号或命令的方法。

2.自动输入法

1)光电输入法,也叫光电识别法,即通过扫描的方法将科技档案信息输入计算机,由计算机把输入的每一个字变成字符标准代码,由计算机代替人工实现文字的录入。

2)语音输入法,也叫语音识别法,即通过话筒把人朗读档案内容的声音信号输入计算机,经过一系列的识别处理,将连话音中的每一个字转化为计算机的字符标准代码,从而完成文字的输入。

3.自动校对法

在计算机录入技术发展的同时,用电子计算机进行校对的技术也达到了实用阶段,形成了各种自动校对方法。

1)智能自动校对法,即根据人工智能原理,建立标准词库形成计算机的智能系统,对录入内容的语法和语义进行检查,并将查出的错误部分显示出来供人们修改。这类系统具有自动学习功能,能在很短的时间内掌握文本的语法、语义特征。编研人员只要根据本专业的特点建立专用标准词库,计算机就能自动对本专业文件进行扫描检查。由于此法目前的校对准确率还不够理想,一般作为人工校对前的预处理。

2)文件比较法。是指对同一份入选档案材料的内容,由不同操作人员各自录入一遍,利用电子计算机的数据处理功能,对这两份内容相同的数据文件逐个字符地进行对比检查,一但发现不一致的现象,计算机就停止校对,提示编研人员根据原稿直接在屏幕上进行修改。此法对于质量要求高、数量大、语种多,传统校对方法难以完成的录入内容的校对具有明显的优越性,是一种比较成熟的计算机自动校对方法,已经广泛应用于拼音文字的校对。

3)自动语音读校法,是由计算机将输入的文字数据转变为语音信号,并模仿人阅读的声音,逐字将文件内容从其扬声器中传输出来,校对者可以根据计算机的阅读声校对原稿,也可以在录入文字的同时,听到录入文字的读音,使录入与校对同步进行。

(二)数字信息的加工方法

1.表格法

表格法是指设计一个表格将编研加工的数据填入其中,进而揭示数据关系的方法。表格具有排列规律、结构重复的特点,特别适合计算机处理,其电子编辑的方法主要有:

1)画线法,即用鼠标或键盘在计算机屏幕上直接画出行线和栏线形成表格,然后填充文字和数据的方法。画线法是一种交互式的制表方法,这种方法与复制方法相结合,进一步加快了制表速度,具有直观、方便,容易掌握的特点,特别适合非专业人员使用。其缺点是随意性较大,难以保证版面的规范性和一致性。

2)设定法,即编研人员根据计算机屏幕上显示的参数表,设定表格的行宽、总行数、栏宽、总栏数等参数,使计算机在屏幕上自动生成规范的表格。这种表格制作方法常与画线法结合使用,适合于制作结构比较规范,层次分明的简单表。

3)命令制表法,即用排版命令对表格的结构,如表头结构特点、线型、行和栏的宽度、数据的排法等内容进行描述,形成小样文件,再经过排版处理生成需要的表格。这是一种采用批处理排版方式制作表格的方法,适合表格较多的情况,可以避免同一种表格的反复设计。

某些专业档案,如水文档案、地质档案、气象档案的编研,常常需要处理大量数据。编研人员可以充分利用已有的数据库文件,运用电子制表的优势与特长,采用专门编制的转换软件或通用仿真制表软件等,直接对数据文件编辑排版,便可以在交互式系统中,直接从数据库中调出需要编辑的数据,自动对数据进行排序、条件过滤,按照编研人员提出的格式要求,自动生成表格文件输出。

2.图示法

图示法,即将选择的相关数据以图示形式表示,以便使数据分析更直观、清晰、易于理解。对手工编研过程中常用的图示,利用电子表格软件可以十分方便、快捷地在计算机屏幕上完成。生成图表的操作方法是:

1)选定图表的数据区域,作为生成图表的依据;

2)选择制图表命令,形成图表区;

3)确定图表类型,从电子表格软件提供的图表类型中,选择其中一种;

4)选择数据的系列、类和图例文字;

5)定义X轴、Y轴及图表标题等;便可顺利形成所需要的图示。

如果需要对图表进行移动、缩放、复制和增加其它成分等编辑加工,只需选中或激活需要加工的区域,就能利用计算机屏幕上的有关按钮自如地实现编研人员的加工意图,最终形成所需要的图示。

(三)图样信息的加工方法

计算机数字图象处理技术的发展,使计算机辅助设计成为科技文件形成的重要手段,提供了电子图样编研加工方法的可能。图样信息是指由线条、符号构成的向量图,如机械图样、电气原理图等。其编研加工方法包括:

1.绘制法

绘制法指借助鼠标、数字化图形板等工具,在计算机屏幕上直接绘制出需要编辑的图形,这是图样制作的基本方法。比较简单的图样可以使用许多交互式排版软件具有的基本图元绘制工具制作。

对于专业性较强的建筑图、机械图、电路图等科技文件则需要用专用软件绘制。目前国内企业、事业单位广泛应用的AutoCAD计算机辅助设计软件,绘图功能很强,具有丰富的图形库和符号库,能够绘制出三维的立体图,制作出来的向量图形文件可以方便地应用于电子编辑系统编制科技档案图集。但绘图软件功能复杂,专业性比较强,要求编研人员既要熟练使用软件;又要掌握一些绘制技巧;还要具备一定的绘图知识,了解各领域工程图的制作要求和规范。

1)电子图样的绘制程序

①确定图形尺寸。绘图之前,要确定图形的整体尺寸和比例,安排图形的整体布局。比较复杂的图形应事先绘出结构草图。

②画基本图形元素。任何复杂图形都是由直线、曲线、圆、三角形、矩形、多边形等基本图形元素组成,绘图时可先将基本图形元素排放好。

③画连线。即用线段将图形元素相交、相切处准确连接,各种不规则曲线和弧线,可以用鼠标或键盘在屏幕上调用“随手画”功能实现。

④填文字、符号。

⑤进行结构的调整、修饰。

⑥存盘。制作完成的图样一定要按需要的文件格式存好盘,当图样较多时,要编制顺序号。

2)图样绘制的技巧及注意事项

①绘制出的图形不容易修改,应尽量减少绘制过程中的调整,力求一次完成。

②绘制过程中注意使用标尺、背景格等有效的辅助工具。标尺能为图形的整体布局、位置分配提供帮助,遍布画面的背景格为绘图时掌握比例、对齐提供了参照。

③灵活切换屏幕显示的比例及光标移动的步距,能够进一步保证图形细部连接的精确、美观。

④使用代号,图中的零件较多时应该以代号表示其名称,代号要用阿拉伯数字,一般从图的左下方开始,按顺时针方向顺序编号。

⑤排好图注即代号的说明。

2.扫描法

扫描法即使用光电扫描仪,将科技档案原件的图形信息输入计算机,再进行编辑加工的方法。纸载体的图样信息必须经过如下过程转化为数字信息,才能进行电子编辑:

1)扫描程序

一般图样文件采用平板式扫描仪输入,高质量的图像信息则要使用滚筒式扫描仪输入。具体方法如下:

①准备原稿。将扫描的科技档案原图面朝下放置在扫描仪的稿台上。

②设置扫描参数。目前使用的扫描仪一般由计算机进行驱动和控制,使用时必须首先启动图片处理软件,根据图片类型选择扫描功能,设定分辨率、亮度、对比度、锐度、扫描比例、扫描长度等参数。

③预扫描。即先对图片进行粗略扫描,将其轮廓大致地显示在屏幕上,以便准确选择实际扫描区域,节省扫描时间,避免对无关内容的扫描。

④定扫描框。即使用鼠标在屏幕上画出需要输入的区域,为正式扫描做准备。

⑤正式扫描输入。使扫描仪按指定参数对图片框内的区域进行精确扫描,将扫描数据传入计算机生成图样文件。

⑥屏幕编辑校正。就是在计算机屏幕上对输入图样的色彩、明暗对比度进行校正等各种修饰,并根据需要添加文字说明。

⑦图样缩放。输入的图样尺寸不符合实际需要时,还要对其画面剪裁取舍,或对其尺寸进行缩放调整,使之符合实际排版的要求。

⑧存盘。图样文件的格式是计算机文件存储的一种结构。文件格式取决于图片处理软件,文件格式必须与软件相适应,才能被计算机读取。因此,图样信息存盘要特别注意文件格式的准确。其主要体现了文件的后缀名,向量图文件用点阵数据表示“TIF”,是其比较通用的格式。科技档案中常见的图样是用CorelDrawAutoCAD 软件绘制的,它们以*.CDR*.GRH*.DXF为后缀名。

2)图样扫描应该注意的问题

第一,原件在扫描仪稿台上的摆放,一定要靠近起始位置,不能放倒、放斜。

第二,扫描的分辨率参数并不是越高越好,应根据图片质量、实际输出设备的精度和图片制作要求等实际情况综合确定。对于1:1比例的普通图样,通常的输入扫描分辨率可以定在180-240目之间。分辨率选择过高不仅不能提高印刷后图样的清晰度,反而会造成扫描时间长、文件过于庞大、自理速度减慢等问题。

(四)图象信息的加工方法

图象信息,指摄影、摄像档案信息,既包括照片、幻灯片和照片等静态的图象信息;也包括电视片和电影片等动态的图象信息。其加工方法除扫描法外还有:

1.屏幕拷贝法,即将计算机屏幕上显示的画面复制下来,编排在版面上的方法,俗称“抓图法”。这种方法是将计算机屏幕显示的入选画面的图象点阵信息,拷贝下来生成一个图象文件。然后利用图象编辑软件对该画面文件进行适当的剪裁、缩放等编辑处理,最后与文字编排在一起输出。在科技档案编研中,往往需要选用某些照片作插图,用其它的方法制作很复杂,从屏幕上截取却十分方便。采用这种制作方法,最好使用计算机图象视频采集装置(例如Video多媒体卡),也可以采用屏幕图象拷贝软件或Windows软件的裁剪板功能等简捷的制作方法。

2.电视图象采集法,即使用专用的装置将需要的电视画面复制下来。档案电视片的制作主要通过将大量录象档案的画面,连续的复制在另一空白录象带上完成的;某些图集、画册或信息快报的制作,也经常需要从声象档案中选材,采用电视图象实时采集装置可以十分方便地实现这一要求。

(五)电子排版方法

通过上述方法将入选材料加工成各种形式的数字式档案信息单元以后,需要将它们组合在一起,即通过档案信息单元的编排和修改实现其有序化,最终形成数字式科技档案编研成品。

1.电子编排

电子编排方法,即通过人机交互的方式,在计算机屏幕上直接对入选信息进行编排布置,实现了“所见即所得”式的加工。一般采用:

1)即打即排法。即文字录入和档案信息单元的编排同步进行。操作者在录入文字时,通过移动光标、选择命令菜单等方式,进行档案信息单元的调整与修改。录完文字编排工作亦告结束,即可打印初稿。这种方法比较适合材料形式单一,编排层次较少的编研成品。

2)注入式编排法。这种方法是将入选的文字内容、表格、图形、图象文件事先分别加工好,然后根据版面的格式要求,把这些内容组合在一起。档案信息形式较多的信息快报、年鉴、科技史志等科技档案编研成品多采用这种编排方法。其操作过程是:

①创建一个新文件,根据预订要求设置页面大小、版心尺寸、正文字体和字号、行距等排版参数,明确版面编排的总体要求。

②排标题。书籍式编研成品标题的排版,要注意统一其位置、字号、排法、字间的回行、加空等,并适当进行标题的美化;期刊、活页式编研成品标题的编排,应该注意多样化以防止其呆板。

③排正文与调整版面。标题排好后,就可以采用“注入”的方法,从磁盘上逐个读取已经加工好的文件,将它们排放到预先设计的版面位置上,同时调整相关文字内容的位置,直至完成全部材料的编排。

④存盘。内容全部编排完毕以后,应将编排制作的初稿存盘。

⑤打印输出。即输出校样,形成编研成品的初稿。

⑥生成页面文件。一些排版软件在完成排版后不能直接输出,需要用有关软件对其进行处理后,才能生成页面文件(如*.S2*.PS文件)输出。

2.编研成品的修改、定稿

编研成品的修改、定稿,即根据输出的校样对编研成品的初稿进行修改。修改往往要经过毛校一改版、一校一改版、二校一改版、三校一改版,一般经过几次校对就要对校样进行几次修改,这样多次反复才能最终形成定稿。在手工编研加工过程中,修改往往占用很大工作量、耗费很长的时间,而计算机修改不仅方便,且大大缩短了修改时间,成为电子编研技术的又一优势。修改方法包括:

1)版式的改动。主要指版面结构上的重新安排布置、信息单元的前后调动、内容的调整更换、字体字号的调整、标题排法的改变、版面的修饰等等。这些一般都要能在排好的版面上进行,但复杂或较大的改动则要重新编排组版。为避免大量修改,编排时不要急于输出定稿。应在内容录入后,选输出一遍没有版式的“毛样”,送编辑人员或原作者核实修改,排除录入、绘制的错误后再进行版面的编排,就可以避免版面的大删大改。

2)文字改动。即根据校样进行文字修改以及内容结构的调整,如大段文字的删除、移动、增加等。修改时借助计算机软件的自动查找和替换功能,能够显著提高修改速度。修改时一定要认真、仔细、防止出现二次修改错误。为此,可采用以下方法:

①分段法,即将比较麻烦的局部内容分成若干段落,分别进行修改。这是一种解决个别修改难点的好方法。

②分类法,对图样、表格、公式、画面等或结构复杂的内容的修改,可按照其形式特征分类,分别由业务熟练者集中修改,然后统一组合在版面内。这种方法可以扬长避短,实现较高的编辑效率,保持全书较为统一的排版风格。

③建立模板文件,即对排版中遇到的内容局部相似或重复的文件,为了简化操作、保证同类文件格式的一致,可以采用建立模版文件的方法,将常用的文件格式及其版心文件整理在一起,分别命名存储。使用时可将该文件格式调出,用复制的方法将需要的内容拷贝成新的文件,然后输入正文内容,实现同类文件的快速排版。

(六)定稿数据文件的整理及存档

编研成品输出付印后,必须要对其数据文件进行整理、存档等印后处理工作。因为,这些数据文件不仅是科技档案编研成品复制印刷的依据,而且在日后信息咨询、档案检索、出版电子出版物等档案信息产品的再生产中,还将发挥广泛的作用,而对数据文件的整理、存档,则是其发挥作用的保障与前提。

1.编后文件整理

1)文件集中整理。编后数据文件存档的版本应该是其定稿,存档形式以文字为主,对于包含大量图样或图片信息的数据文件,可将其压缩后存储在磁盘上,如同一内容的分文件数量较多,则要根据文件数据长度适当合并。

2)妥善拷贝保存。将文件集中拷贝在软盘、硬盘及光盘等存贮介质上,是印后处理过程的关键。

3)文件格式转换。对需要存入数据库的文件,应根据计算机系统的要求,整理成一定的格式。目前主要有四种格式:其一,适宜利用的格式,即除去排版注释和控制字符,在文章标题、章、节处加入一些检索符号,以便于用户检索的格式;其二,通用标准格式,即除去所有排版注释和控制字号符,整理成纯文字的符合信息交换的格式,如Wordstar文件格式;其三,电子出版物格式,即采用国家标准的置标语言SFML格式;其四,照原样保存的存版格式。

4)存储登记。存储文件一定进行登记,否则将无法查找利用。

2.磁盘的清理和维护

1)磁盘的清理和维护的内容,包括:删除无用文件,释放磁盘空间;对磁盘目录进行整理,清除无用的子目录;对个磁盘进行维护等3项内容。这是一项十分细致的工作,清理时既要清除无用的“垃圾文件”,又不能破坏系统文件,更不能误删有用的文件。这项工作虽然可以由系统管理人员完成,但是,编研人员应养成自觉维护计算机磁盘的好习惯,这样能够及时恢复计算机的运行速度,减少错误,保证计算机安全、高效地工作。

磁盘清理维护的一般方法是:将盘上所有的无用文件、可重复生成的页面输出文件(如*.BAK文件)删除,如,将已经发排完成或复制存档的编研成品数据文件和无用的子目录清除,以释放磁盘空间。

2)复制存档文件,为了保证编研数据文件的安全,可以采用分盘的方法,即在计算机磁盘上划出一个逻辑盘,作为专门存储文件的“ 仓库”,使“ 工作盘”( 如C盘)和“仓库盘”(如D盘)在工作中互不相扰。整理磁盘时,将工作盘上所有数据文件和有关排版参数(如*.PRO)文件,全部复制到建有对应子目录的仓库盘中存储备份,同时删除其余所有用户文件,使工作盘中只保留系统软件,这是一种较为彻底的磁盘清理方法。

3)整理磁盘。为了克服磁盘上文件存放分散的问题,可使用计算机磁盘优化软件对磁盘上的所有文件进行整理,将文件集中存放到一个连续的区间内,把空闲的空间移到磁盘后面,这样处理后的磁盘工作速度会恢复如初,使用起来也更为安全可靠。


相关阅读
发表评论
0评