檔案整理的關鍵因素,檔案數字化到底該如何加工?鴻博檔案來支招

檔案整理的關鍵因素,檔案數字化到底該如何加工?鴻博檔案來支招

一、定義

檔案數字化是隨著計算機技術、掃描技術、OCR技術、數字攝影技術(錄音、錄影)、資料庫技術、多媒體技術、儲存技術的發展而產生的一種新型檔案資訊形態將其轉化為儲存在磁碟、光碟等載體上,並能被計算機識別的數字影象或數字文字的處理過程。

檔案數字化是一種新型的檔案資訊管理模式,它把各種載體的檔案資源轉化為數字化的檔案資訊,以數字化的形式儲存,網路化的形式互相連線,利用計算機系統進行管理,形成有序結構的檔案資訊庫,及時提供利用,實現資源共享。

二、數字化步驟

前期檔案整理

檔案借出

從檔案室接件,填寫檔案移交清冊,一式兩份。拿到檔案後,開始核對檔案數量,數量核對無誤後簽字確認,將檔案拿回加工現場。

目錄資料準備

按照各類檔案整理規定的要求,在檔案管理系統著錄目錄資料。如有錯誤或不規範的案卷題名、檔名、責任者、日期、起止頁號等,應進行修改。

拆除裝訂

在不去除裝訂物情況下,會影響掃描工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。

頁面修整

破損嚴重、無法直接進行掃描的檔案,應先進行技術修復,折皺不平影響掃描質量的原件應先進行相應處理(壓平或熨平等)後再進行掃描。

檔案掃描

掃描方式

(1)根據檔案幅面的大小(A4、A3、A0等)選擇相應規格的掃描器或專業掃描器(如工程圖紙可採用0號圖紙掃描器)進行掃描。大幅面檔案可採用大幅面數碼平臺,或者縮微拍攝後的膠片數字化轉換裝置等進行掃描。

(2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應採用平板掃描方式;紙張狀況好的檔案,可採用高速掃描方式以提高工作效率。

掃描色彩模式

(1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常採用彩色。

(2)頁面為黑白兩色,並且字跡清晰、不帶插圖的檔案,可採用黑白二值模式進行掃描。

(3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可採用灰度模式掃描。

(4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可採用彩色模式進行掃描。

掃描解析度

(1)掃描解析度引數大小的選擇,原則上以掃描後的影象清晰、完整、不影響影象的利用效果為準。

(2)採用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其解析度一般應設為200-300dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高解析度。

影象處理

影象資料質量檢查

(1)對影象偏斜度、清晰度、失真度等進行檢查。發現不符合影象質量要求時,應重新進行影象的處理。

(2)由於操作不當,造成掃描的影象檔案不完整或無法清晰識別時,應重新掃描。

(3)發現檔案漏掃時,應及時補掃並正確插入影象。

(4)發現掃描影象的排列順序與檔案原件不一致時,應及時進行調整。

糾偏、去汙、影象拼接、裁邊處理

(1)對出現偏斜的影象應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的影象應進行旋轉還原,以符合閱讀習慣。

(2)對影象頁面中出現的影響影象質量的雜質,如黑點、黑線、黑框、黑邊等應進行去汙處理。處理過程中應遵循在不影響可懂度的前提下展現檔案原貌的原則。

(3)對大幅面檔案進行分割槽掃描形成的多幅影象,應進行拼接處理,合併為一個完整的影象,以保證檔案數字化影象的整體性。

(4)採用彩色模式掃描的影象應進行裁邊處理,去除多餘的白邊,以有效縮小影象檔案的容量,節省儲存空間。

影象儲存

儲存格式

(1)採用黑白二值模式掃描的影象檔案,一般採用PDF格式儲存。

(2)採用灰度模式和彩色模式掃描的檔案,一般採用PDF格式儲存。

影象檔案命名

(1)紙質檔案目錄資料庫中的每一份檔案,都有一個與之相對應的檔號,以該檔號為這份檔案掃描後的影象檔案命名。如影象檔案較大,不便於網路瀏覽,可拆分為多個影象檔案,檔名後增加A、B、C等區別。

(2)分別建立資料夾,以檔案檔號命名,並存儲對應影象檔案。

資料掛接

將每一份紙質檔案掃描所得的影象儲存到相應檔號的資料夾後,認真核查每一份影象檔案的名稱與檔案目錄資料庫中該份檔案的檔號是否相同,影象檔案的頁數與檔案目錄資料庫中檔案的總頁數是否相同等。透過每一份影象檔案所在資料夾的名稱與檔案目錄資料庫中該份檔案的檔號的一致性,建立起一一對應的關聯關係,為實現檔案目錄資料庫與影象檔案的批次掛接提供條件。