【0dsyong.com--工作總結(jié)范文】
數(shù)字化是指將任何不斷變化的輸入如圖片的線條轉(zhuǎn)換為一系列單獨的單元,這些單元在計算機中由0和1表示。這種轉(zhuǎn)換通常使用模數(shù)轉(zhuǎn)換器執(zhí)行。 以下是為大家整理的關(guān)于檔案數(shù)字化解決方案的文章3篇 ,歡迎品鑒!
一、適用范圍
1、用戶特征
◆普通意義上的政府、事業(yè)、企業(yè)用戶,檔案的管理沒有明顯的行業(yè)特征,可以經(jīng)過簡單的設(shè)置滿足管理上的個性;
◆只負責(zé)管理本單位的檔案,不負責(zé)其它相關(guān)單位或下屬單位檔案的保管和利用;
◆雖然有寵大的分支機構(gòu)存在,但初期建設(shè)只到總部。
2、檔案管理機構(gòu)的形式
檔案管理機構(gòu)以檔案室、檔案科、檔案處等形式存在,集中管理本單位產(chǎn)生的各類檔案信息。
二、信息管理的種類
主要包括文書檔案、科技檔案、工程檔案、基建檔案、會計檔案、聲像檔案、照片檔案、實物檔案、合同檔案、設(shè)備檔案等以及圖書、期刊、情報等資料。
三、方案組成
標(biāo)準(zhǔn)解決方案以“綜合檔案管理系統(tǒng)(單全宗)版本為基礎(chǔ)檔案管理平臺,在此平臺的基礎(chǔ)上結(jié)合全文檢索、OCR、流媒體服務(wù)、圖像處理、信息加密、信息發(fā)布等眾多先進技術(shù)組合而成的應(yīng)用解決方案。
3.1檔案管理平臺
◆模板自定義技術(shù)
綜合檔案管理系統(tǒng)的開發(fā)完全基于檔案管理平臺理念設(shè)計,系統(tǒng)的各個管理和應(yīng)用體系均提供模板自定義技術(shù)。用戶可以在原有模板基礎(chǔ)上局部調(diào)整,也可以創(chuàng)建全新的模板,模板的自定義工作無須編程就可以實現(xiàn)。模板自定義技術(shù)給用戶提供了廣闊的個性空間,用戶可以快速的部署適合自身特點的檔案系統(tǒng),并且能夠在自身需求、管理模式上發(fā)生變化時隨需應(yīng)變。
◇自定義檔案管理類型及層次;
◇自定義文件管理類型及層次;
◇自定義其它管理模板類型及層次,比如查、借閱、統(tǒng)計、編研模板;
◇自定義數(shù)據(jù)庫結(jié)構(gòu);
◇自定義錄入字段及界面布局;
◇自定義檔號自動生成規(guī)則;
◇自定義報表輸出規(guī)則;
◇自定義數(shù)據(jù)排序規(guī)則;
◇自定義歸檔流水號規(guī)則;
◇自定義關(guān)聯(lián)錄入規(guī)則;
◇自定義WEB發(fā)布頁面;
◇自定義條形碼管理;
◇文件歸檔、鑒定設(shè)置;
◇歸檔整理規(guī)則設(shè)置;
系統(tǒng)支持對各類文件信息的歸檔整理、這些信息包括公文、從OA、PDM等業(yè)務(wù)系統(tǒng)采集的預(yù)歸檔信息等;系統(tǒng)支持多點立卷,即可以由各個業(yè)務(wù)職能處室通過本系統(tǒng)獨立進行立卷歸檔;系統(tǒng)支持改革后的文書檔案整理規(guī)則;文件信息和檔案信息的歸檔對應(yīng)關(guān)系可以自定義。
◆文件自動分類、鑒定
系統(tǒng)提供保管期限、分類表維護功能。在此模塊中對文件設(shè)置分類、并定義好保管期限、歸屬的“目錄號”設(shè)定好歸檔范圍關(guān)鍵詞,在歸檔時系統(tǒng)會智能解析文件標(biāo)題,自動分類、鑒定并形成分類號、保管期限,自動分類技術(shù)和立卷歸檔以及檔案模板中字段值設(shè)置等功能結(jié)合起來,使智能、快速歸檔成為可能。
◆主題詞自動標(biāo)引
系統(tǒng)內(nèi)置主題詞庫,并支持用戶修改主題詞;系統(tǒng)可以自動分析文件標(biāo)題,實現(xiàn)主題詞的自動標(biāo)引。
◆業(yè)務(wù)管理平臺
系統(tǒng)提供檔案的查、借閱、統(tǒng)計、編研、銷毀、保管、庫房管理、數(shù)據(jù)錄入、報表輸出、檢索查詢等完整功能,在此可以實現(xiàn)檔案業(yè)務(wù)的高效、自動管理。
◆信息利用平臺
可以在檔案查詢系統(tǒng)的基礎(chǔ)上,結(jié)合用戶的需求建立的綜合檔案信息網(wǎng)站,使之成為單位檔案信息的門戶。用戶可以在此網(wǎng)站設(shè)置不同的欄目頻道,并可實現(xiàn)對發(fā)布信息的維護更新;同時該網(wǎng)站更是檔案信息的發(fā)布及查詢平臺,查詢用戶可以根據(jù)自身的權(quán)限檢索、瀏覽檔案信息,并可以在此提出利用申請及預(yù)約。
◆安全防護平臺
信息安全是檔案信息利用的基礎(chǔ),系統(tǒng)提供權(quán)限管理、數(shù)據(jù)加密、數(shù)據(jù)備份及恢復(fù)、日志管理、訪誤刪除等完整的安全防護體系,確保信息資源能夠安全存儲并安全訪問。
◆多文件瀏覽技術(shù)
綜合檔案管理系統(tǒng)支持多種圖形、圖像文件格式的管理和瀏覽,無需安裝相應(yīng)的應(yīng)用程序即可通過瀏覽器打開原文進行瀏覽,并且瀏覽器和用戶權(quán)限進行了集成,可以防止非法用戶的瀏覽、下載、打印。
3.2相關(guān)技術(shù)集成
為提高檔案管理系統(tǒng)的應(yīng)用效果,綜合檔案管理系統(tǒng)和其它相關(guān)成熟的技術(shù)和應(yīng)用進行了集成,這主要包括全文檢索、OCR以及流媒體服務(wù)等。通過集成,可以實現(xiàn)對檔案內(nèi)容的高效檢索、掃描文件信息的自動提取及查詢、以及音視頻檔案的網(wǎng)絡(luò)點播等功能。
◆全文檢索
隨著檔案信息化建設(shè)的不斷深入,產(chǎn)生了大量的不同類型的電子文檔,這此信息包括數(shù)據(jù)庫、文本文件、圖形、圖像等,資料多半已不再只以結(jié)構(gòu)性資料來存取,反而較偏向以半結(jié)構(gòu)化或非結(jié)構(gòu)化資料的存取方式,傳統(tǒng)的數(shù)據(jù)庫查找的處理效能日益銳減,存在較大不足:
◆非結(jié)構(gòu)化信息的檢索問題
系統(tǒng)內(nèi)產(chǎn)生的大量電子文件的內(nèi)容大多數(shù)為非結(jié)構(gòu)化信息,比如HTML文檔、文本文檔等,檔案管理系統(tǒng)主要對文檔的描述信息(目錄)進行檢索,找出對應(yīng)的電子文件,但不能對電子文件的正文內(nèi)容進行檢索。
◆無法對異質(zhì)信息進行整合
用戶需要將各種不同來源的信息(WEB、DB、非結(jié)構(gòu)化和半機構(gòu)化文檔以及各應(yīng)用系統(tǒng)中)整合成一個單一的信息平臺,以統(tǒng)一的入口跨信息源搜索信息。
◆查找的效率存在巨大缺陷
傳統(tǒng)的數(shù)據(jù)庫查找缺少必要的語義分析,與查找內(nèi)容符合的信息就能夠查找出來,而沒有進一步的判斷,比如我們查找“民法”,但數(shù)據(jù)庫查找會現(xiàn)“人民法院”也同時顯示出來,數(shù)據(jù)庫查找機制會導(dǎo)致查找出大量的無用信息,同時對海量數(shù)據(jù)進行數(shù)據(jù)庫查找時效率呈現(xiàn)幾何級下降。
全文檢索技術(shù)的出現(xiàn)大大改變了我們傳統(tǒng)的信息查找模式,通過全文檢索組件,實現(xiàn)對結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化信息的統(tǒng)一整合,形成完整的索引數(shù)據(jù)庫,配合語義分析、智能分類、多國語義支持等技術(shù)實現(xiàn)對異質(zhì)信息的快速檢索。
◆創(chuàng)建全文索引庫
系統(tǒng)可以對掃描完成的圖像文件(TIF格式)、各類電子文本(HTML、TXT、OFFICE格式文件)自動進行全文識別并和相應(yīng)的檔案保存描述性PDI(分類和目錄)一起建立起相應(yīng)的全文索引庫。
◆搜索引擎
用戶可以在WEB查詢系統(tǒng)中通過輸入關(guān)鍵詞,對檔案數(shù)據(jù)庫中的正文進行檢索,在檢索過程中可以設(shè)置檢索范圍,并且可以在檢索結(jié)果中再進行分層檢索,檢索出來的檔案信息可以根據(jù)權(quán)限進行再編輯,提高了文件檢索的查全率、查準(zhǔn)率。
◆全文檢索的強大功能
1、可行實現(xiàn)對關(guān)系型數(shù)據(jù)庫、Html、Text、Office等來源的信息進行搜尋。
2、支持「英文萬用字符(*、?)查詢」。英文單字是由多個英文字母組成的,使用者可查詢部分英文字及*(代表多于一個英文字母)或?(代表一個英文字母)的組合。
3、搜尋條件具有完整的布爾邏輯運算AND、OR、NOT能力,支持復(fù)合式布爾邏輯運算查詢,并且可以配合多組左括號"("與右括號")"作關(guān)鍵詞查詢優(yōu)先級的設(shè)定,方便查詢者輸入布爾組合查詢條件。
4、內(nèi)建「智能型快速響應(yīng)模式」(Smartcache)機制,可以提供同一種查詢條件之重復(fù)使用率,提高系統(tǒng)資源的效益。Cache儲存目錄記錄了Cache檔案所要放置的地址,經(jīng)查詢過的資料或畫面,第二次再進入時,可重復(fù)使用第一次查詢結(jié)果。
5、Unicode索引建置及查詢??芍С侄鄧Z系(英文、繁簡體中文、日文、Unicode等)混合的文件的建置與查詢。
6、中英文容錯查詢:中英文容錯功能FuzzySearch,基于文字特性,很多名詞及詞匯依情況不同,也許衍生出通用的簡稱,或是文字次序?qū)φ{(diào)。也有可能因為模糊不明確的意象,使用者希望只需要輸入一個關(guān)鍵詞,就能一并查詢性質(zhì)類似或相關(guān)之信息。比如:輸入「MobileNetwork」可查到「MobileApplianceNetwork」等特定距離的詞句、輸入「產(chǎn)業(yè)研究」可查到「產(chǎn)業(yè)結(jié)構(gòu)研究」、「產(chǎn)業(yè)….研究」等,擴展搜尋的完整性。
7、提供中文字、詞查詢及英文詞組檢索:提供中文字詞索引查詢功能,透過智能型自動斷詞技術(shù)以達到詞索引的效果,解決輸入“合資”會找到“整合信息”等搜尋不精確的問題。支持/多字段/多條件檢索,來取得數(shù)據(jù)庫資料,并可跨資料表、跨信息字段進行索引建置與搜尋。提供詞索引/搜尋功能,濾除搜尋結(jié)果噪聲。
8、中英文同義詞組查詢:系統(tǒng)內(nèi)置18萬組同義詞庫,實現(xiàn)對檢索詞組的同義詞關(guān)聯(lián)查詢。
9、屬性查詢(高級查詢):支持對數(shù)據(jù)庫的字段設(shè)定檢索內(nèi)容組合查詢。
10、智能型自然語言斷詞,詞索引能力:為提高查詢檢索的準(zhǔn)確度,系統(tǒng)采用自然語言斷詞機制和靈活的詞索引開關(guān),用戶可根據(jù)需要選擇詞索引或字索引。具體功能如下:
1)中文句子將被自動分析與斷詞,并建立詞索引;
2)詞索引功能通過開關(guān)靈活設(shè)置;
3)檢索字串首先通過自動斷詞,將其斷詞結(jié)果進行組合檢索;
4)提供「詞庫」編輯器,針對斷詞用的「詞庫」進行維護和調(diào)整;提高查詢的速度和準(zhǔn)確度。該功能如下:
◇提高精確度:輸入「民法」不會找到「人民法院」;
◇更小的索引空間:–通過詞索引的方式,索引數(shù)據(jù)庫相對字索引需要更少的磁盤空間;同樣數(shù)據(jù)量下,檢索時需要的Memory更少;
◇檢索性能高:配合高效算法,詞索引的搜索性能相對字索引平均高出3倍以上;
11、近似概念詞庫檢索;
12、靈活開發(fā)特殊信息源,文件格式;
13、支持海量存儲;
14、支持分布式架構(gòu)。
3.3.通用接口
伴隨著信息化建設(shè)的加快,各單位逐漸建立起OA、MIS、ERP、PDM等系統(tǒng)(統(tǒng)稱OA),這些系統(tǒng)產(chǎn)生的大量有價值的信息都需要歸檔。這就要求綜合檔案管理系統(tǒng)應(yīng)能夠和眾多業(yè)務(wù)系統(tǒng)建立有效的交互,保證歸檔信息按照檔案的要求及時、規(guī)范的轉(zhuǎn)入到檔案系統(tǒng)里。通過多年的技術(shù)積累,綜合檔案管理系統(tǒng)已經(jīng)和眾多涉及不同平臺的業(yè)務(wù)系統(tǒng)建立了有效的交互,保證數(shù)據(jù)順暢歸檔。
數(shù)字化房產(chǎn)檔案建設(shè)方案
檔案工作的數(shù)字化建設(shè)是順應(yīng)潮流,適應(yīng)時代發(fā)展的新舉措。隨著城市的發(fā)展和進步,房產(chǎn)檔案的形成會越來越多,類別越來越細,而傳統(tǒng)手工作業(yè)方法已經(jīng)呈現(xiàn)出了許多弊端:效能低、錯誤多、易損毀、易丟失。所以數(shù)字化檔案的建設(shè)在當(dāng)前的檔案管理工作中的重要性正日益凸顯出來。對于我局檔案館的數(shù)字化建設(shè)特制定以下方案:
一、制定批次
為在數(shù)字化處理過程中對紙質(zhì)檔案進行有效的管理及對數(shù)字化處理進行有效控制,需對館藏的檔案按照類別進行批次安排,確保在數(shù)字化過程中有序進行。
二、數(shù)字化處理
1、檔案出庫交接
根據(jù)數(shù)字化加工批次計劃進行出庫,對出庫的檔案進行完整性檢查,對通過完整性檢查的檔案,進行數(shù)量確認,并詳細登記《檔案出庫單》,確保交接中檔案數(shù)量的正確性和完整性。
2、目錄制定及檔案整理
按照文件數(shù)據(jù)庫目錄結(jié)構(gòu)及目錄著錄要求,規(guī)范需要目錄補錄的檔案目錄內(nèi)容,包括確定檔案目錄的著錄項、字度長度等規(guī)范要求。
對出庫檔案進行數(shù)字化加工前,需對檔案文件進行掃描
前處理,使之成為能夠進行掃描的形態(tài)。對影響掃描的非成冊檔案裝訂進行拆除裝訂物,對破損嚴重,無法進行掃描的文件應(yīng)進行技術(shù)處理,如紙張褶皺無法掃描的應(yīng)進行壓平等處理。對于檔案內(nèi)的資料應(yīng)區(qū)分掃描件和非掃描件,并詳細記錄,確保檔案內(nèi)的資料不亂不丟。掃描完成后按照檔案館的要求進行裝訂,保證每卷檔案不掉頁,邊緣整齊。
3、檔案掃描
根據(jù)文件數(shù)據(jù)庫要求的規(guī)格進行檔案掃描,保證掃描件圖像效果與原件吻合。大幅面檔案采用大幅面掃描儀或者小掃描儀掃描后進行圖片拼接。核對每份文件的掃描頁碼、頁數(shù)與實際的文件頁碼、頁數(shù)是否一致。對掃描圖像進行命名時一定要正確,不能出現(xiàn)圖片顛倒、錯亂等現(xiàn)象,掃描時要保證檔案原件不被損壞。
4、圖像處理
對顛倒、偏斜的圖像進行糾偏處理,以符合閱讀習(xí)慣。對頁面中影響閱讀的污點、黑線、黑邊等雜質(zhì)進行去污處理。對顏色深淺度進行調(diào)整,確保圖像字跡清晰,對大幅面掃描所形成多幅圖像進行拼接,合并為一個完整圖像,以保證數(shù)字化圖像的完整性。
5、文件錄入
根據(jù)數(shù)字檔案管理的軟件以及文件數(shù)據(jù)庫的要求,將掃描后的圖像按照檔案編碼進行錄入,在錄入過程中要做到不
漏頁、不亂頁,對錄入的文件要進行準(zhǔn)確性核對,確保文件的完整。
6、目錄整理
文件錄入完畢后應(yīng)按照系統(tǒng)內(nèi)的文件目錄制定館藏紙質(zhì)檔案的的索引目錄,以確定每份電子檔案在檔案館中原件的位置,做到不亂、不錯。
7、檔案入庫
完成數(shù)字化處理后,應(yīng)按照制定的檔案目錄進行歸檔上架,由接收人檢查檔案的完整性,并核對《檔案出庫單》,確保文件不丟失。
檔案出庫
檔案入庫
檔案整理
目錄整理
文件錄入檔案掃描
圖像處理
三、人員培訓(xùn)及安排
由于檔案管理的專業(yè)性,在工作開始前,由業(yè)務(wù)單位及產(chǎn)權(quán)檔案室各出一人為工作人員進行檔案管理培訓(xùn),培訓(xùn)期為10個工作日。
為保證檔案數(shù)字化順利有序進行,對工作流程中各個崗位做出如下安排:
1、檔案出入庫、批次制定1人,在制定批次后,負責(zé)提檔并做好記錄以及接檔核對記錄。
2、目錄制定及檔案整理共2人,一人負責(zé)檔案的分冊、目錄制定,一人負責(zé)掃描前檔案處理。
3、檔案掃描1人,嚴格按照批次掃描處理好的檔案。
4、圖像處理1人,將掃描好的圖像做去污、調(diào)整、邊框剪切等工作。
5、文件錄入4人,將處理好的數(shù)字化文件及相關(guān)信息錄入數(shù)據(jù)庫。
6、目錄整理1人,負責(zé)錄入完的文件裝訂及編號。
四、所需辦公用品清單
為加快檔案數(shù)字化過程,減少工作繁瑣度?,F(xiàn)需要以下辦公用品:
1、電腦打印機6套(電腦要求可以進行圖像處理,打印機5臺激光1臺針式)
2、高速掃描儀1臺,高拍儀1臺
3、雙面復(fù)印機1臺
4、裝訂機1臺,碎紙機1臺
5、檔案盒、文件夾、資料冊、索引紙、檔案袋、標(biāo)簽紙、號碼機、拆封刀、裁紙刀、訂書機、訂書針、曲別針、大頭針、圖章、印油若干
檔案館的數(shù)字化能夠通過互聯(lián)網(wǎng)、政務(wù)網(wǎng)、局域網(wǎng)進行計算檢索及查閱檔案,極大的提高了工作效率,對紙質(zhì)檔案的利用保護起到了重要的作用。各工作人員應(yīng)本著認真負責(zé)的態(tài)度,在整個數(shù)字化處理的過程中,嚴格按照要求規(guī)范工作方法,爭取圓滿完成檔案數(shù)字化工作。
摘要:隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,檔案管理也發(fā)生了很大的變化,實現(xiàn)了檔案數(shù)字化發(fā)展和數(shù)字檔案的網(wǎng)絡(luò)化應(yīng)用,這樣能夠更好對一些珍貴的檔案原件進行管理,同時也能更好的實現(xiàn)檔案數(shù)字化技術(shù)的發(fā)展,這樣能夠更好的對檔案信息進行保管。
關(guān)鍵詞:數(shù)字化;掃描;信息存儲
信息時代的來臨,檔案信息資源在社會主義現(xiàn)代化建設(shè)過程中發(fā)揮了非常重要的作用。檔案在人們的生活和工作中具有很大的影響意義,這樣檔案的作用和價值才能得到更好的體現(xiàn)?,F(xiàn)在,人們在生活和工作中,要對檔案歷史信息進行更好的保護,這樣在進行使用的時候才能更好的保證得到很好的利用。檔案數(shù)字化是檔案信息化建設(shè)過程中非常重要的基礎(chǔ)工作,同時在進行檔案管理過程中要對計算機技術(shù)進行很好的利用,這樣才能在工作流程方面更加的合理,同時也能更好的將原始的資料進行高效、準(zhǔn)確的進行處理,將其轉(zhuǎn)變成為數(shù)字檔案。如何將原始資料變成為數(shù)字檔案也是檔案工作者和技術(shù)開發(fā)人員要進行研究的問題。在日常的檔案管理中,已經(jīng)形成了非常規(guī)范的管理方法,同時對檔案的保護和保密工作也是非常重視的,這樣能夠更好的提高檔案查詢的效率,同時,在社會發(fā)展過程中也能更好的對檔案資源進行使用。為了更好對檔案進行管理,實施檔案數(shù)字化發(fā)展非常重要,建立一套數(shù)字化檔案管理信息系統(tǒng)能夠更好的解決檔案管理過程中數(shù)字化建設(shè)問題。在檔案工作中,對工作經(jīng)驗進行總結(jié),能夠更好的從檔案業(yè)務(wù)能力方面和技術(shù)方案方面更好的解決檔案數(shù)字化發(fā)展和數(shù)據(jù)存儲方案的解決。
1檔案數(shù)宇化業(yè)務(wù)過程模型
檔案數(shù)字化是一項非常復(fù)雜的系統(tǒng)工程,在進行處理的時候要對電子檔案信息進行獲取,同時在信息處理、信息儲存和信息發(fā)布和利用方面都要進行很好的發(fā)展。電子檔案信息在獲取的時候可以通過很多的渠道來進行實現(xiàn)。在技能型信息獲取的時候,可以對紙質(zhì)的檔案進行掃描加工,也可以對磁帶和磁盤中儲存的檔案進行數(shù)字化轉(zhuǎn)換,這樣能夠更好的將采集到的數(shù)據(jù)信息更好的轉(zhuǎn)化成為數(shù)字化形式。無論采取何種形式對技術(shù)參數(shù)進行處理都要有專業(yè)的設(shè)備和文件儲存方式,要保證儲存介質(zhì)的安全性,同時要保證信息能夠更好的進行處理。在檔案信息化處理過程中,數(shù)字化解決方案是核心的功能,其中包含著檔案信息的編目、標(biāo)引、圖像文件處理以及圖像識別處理,這樣能夠更好的對檔案目標(biāo)信息進行關(guān)聯(lián)。在這個過程中,系統(tǒng)中每個功能模塊都要借助軟件開發(fā)平臺進行建設(shè),同時要對用戶的操作環(huán)境的控制。檔案信息儲存的安全非常重要,因此,在整個系統(tǒng)中一定要保證信息的安全,同時要保證系統(tǒng)能夠更好的運行支撐。在這個環(huán)節(jié)中,系統(tǒng)的儲存量是有一定的要求,在安全管理方面也有一定的基本要求,同時也要對訪問的速度進行控制,對儲存的設(shè)備也是有一定的要求。各種電子檔案信息在儲存和訪問方式也要進行選擇,這樣能夠更好的對檔案信息的儲存方式進行決定。在檔案信息利用中,檔案數(shù)字化發(fā)展是必然趨勢,同時在這個環(huán)節(jié)中要對查詢和利用的平臺進行建設(shè),這樣能夠更好的對網(wǎng)絡(luò)中出現(xiàn)的信息進行保證,同時也能更好的保證人們在生活和工作中對網(wǎng)絡(luò)中存在的信息進行使用。網(wǎng)絡(luò)中存在的信息具有很好的共享性,這也是檔案信息的重要價值和作用。在對檔案進行保管的時候,對其隱私性也有要求,這樣才能更好保證信息的安全。
2檔案數(shù)字化主要技術(shù)指標(biāo)的選擇
紙質(zhì)檔案實現(xiàn)數(shù)字化的過程要使用數(shù)字化掃描技術(shù)、圖文編輯、圖像格式和圖像儲存技術(shù)進行發(fā)展,這樣能夠更好的對相關(guān)的技術(shù)和參數(shù)進行選擇。對紙質(zhì)檔案進行數(shù)字化能夠更好的實現(xiàn)掃描加工,同時也能更好地對信息質(zhì)量進行檢查,同時對出現(xiàn)的污染問題也能進行更好的處理,這樣更好的實現(xiàn)檔案文件的信息關(guān)聯(lián)。
2.1掃描技術(shù)參數(shù)選擇
在對紙質(zhì)檔案進行掃描的時候,要采用標(biāo)準(zhǔn)的編程接口,這樣能夠更好的應(yīng)用編程程序?qū)Ω鞣N掃描儀器進行控制,同時也要實現(xiàn)自動圖像壓縮儲存。在這個過程中,有不同的掃描方式,可以支持不同的幅面和顏色,也能夠?qū)Σ噬珗D像進行處理。在掃描過程中,要對分辨率進行必要的設(shè)置,要根據(jù)實際的業(yè)務(wù)進行靈活的設(shè)置,同時,也要滿足網(wǎng)絡(luò)化的查詢利用,對具體參數(shù)的掃描分析清晰度和質(zhì)量因素進行綜合選擇,因此,在進行掃描的時候可以提高掃描分辨率。
2.2OCR識別技術(shù)
OCR技術(shù)可用于檔案標(biāo)引信息識別和全文信息識別。在理想的測試條件下,其主要技術(shù)指標(biāo)如下:識別字體:識別宋體、仿宋、楷體、黑體、魏碑、隸書、圓體、行楷、行書等近百種字體。識別功能:支持印刷文稿、純英文、中英文混排、較工整的手寫文稿等多種類型。對印刷材料的識別率達98%以上。識別速度:在普通配置的計算機上印刷體漢字達120字/秒以上。要求圖像分辨率:一般不低于300DPI。由于大量實際檔案的紙張、字體和測試樣例往往存在較大差距,因此OCR在實際應(yīng)用中自動識別的準(zhǔn)確度和穩(wěn)定性會有較大的折扣,這使我們不得不遺憾地面臨艱苦而繁瑣的人工校對和補錄工作。
2.3圖像文件密級定義技術(shù)
為了在較細粒度上實現(xiàn)對電子檔案圖像信息的安全訪問與控制,可通過采用頁定級或頁內(nèi)區(qū)域定級,即指定某頁或頁內(nèi)某區(qū)域的保密級別。保密級別可分為公開級、國內(nèi)級、內(nèi)部級、秘密級、機密級、絕密級等等。頁定級與頁內(nèi)區(qū)域定級之后,通過用戶角色授權(quán),便可實現(xiàn)精細的數(shù)據(jù)訪問控制和權(quán)限管理。
2.4多媒體音像檔案數(shù)字化技術(shù)參數(shù)
多媒體音像檔案數(shù)字化,就是將錄音、錄像等各種形式的多媒體原文資料通過音頻、視頻轉(zhuǎn)換設(shè)備進行轉(zhuǎn)換、識別,壓縮,生成標(biāo)準(zhǔn)格式的電子文件,并編目以及建立標(biāo)引信息的過程。
2.5條碼技術(shù)
文檔數(shù)字化加工的全過程,采用條形碼技術(shù)進行跟蹤管理是非常有效的手段之一。通過采用條碼可以實現(xiàn)下述自動化處理:在檔案整理工序中加貼表示不同意義的條碼,可以實現(xiàn)案卷號、檔案分類等關(guān)鍵標(biāo)引信息的自動識別。檔案移交過程中,可利用條碼自動進行檔案的逐卷核對;檔案盤點時,通過條碼掃描槍或無線數(shù)據(jù)采集器進行條碼掃描,可實現(xiàn)庫房檔案數(shù)量的精確統(tǒng)計,同時還可以實現(xiàn)庫房實物檔案與計算機中存儲的檔案信息的核對。在檔案的借閱管理工作中,可應(yīng)用條碼進行自動化的出入庫管理。
2.6數(shù)字檔案信息的存儲
數(shù)字化后的數(shù)字檔案信息包括檔案目錄信息和圖像原文信息兩大類,為了實現(xiàn)網(wǎng)絡(luò)化利用,檔案的目錄數(shù)據(jù)庫必須采用支撐網(wǎng)絡(luò)化系統(tǒng)運行的數(shù)據(jù)庫,而數(shù)字化后的電子圖像文件的存儲則可以選擇文件存儲方式或數(shù)據(jù)庫存儲方式任何一種存儲方式,如果選用數(shù)據(jù)庫存儲,則要求數(shù)據(jù)庫服務(wù)器的存儲容量足夠大,如果選用文件存儲,則應(yīng)考慮存儲在文件服務(wù)器上文件的存儲規(guī)則和命名規(guī)則,以方便實現(xiàn)圖像文件與數(shù)據(jù)庫的檢索。
3結(jié)束語
在檔案工作中,檔案數(shù)字化是非常新的一項內(nèi)容,因此,在建設(shè)過程中無法避免的會遇到一些新問題和新情況。數(shù)字化檔案信息在壓縮和儲存關(guān)鍵技術(shù)方面要進行更好的發(fā)展,這樣才能更好地保證數(shù)字化檔案信息的安全,同時在保密技術(shù)方面也要進行很好的發(fā)展,這樣才能更好的保證數(shù)字化檔案信息能夠更好的實現(xiàn)訪問方式和安全控制。數(shù)字化檔案在進行建設(shè)的過程中要面臨著很多的問題,對出現(xiàn)的問題進行解決才能更好的促進檔案工作得到更好的發(fā)展,在檔案管理水平方面得到提高。
參考文獻
[1]張晶晶.數(shù)字檔案存儲介質(zhì)及格式研究[D].蘇州大學(xué),2009.
[2]劉祥麟.數(shù)字檔案存儲介質(zhì)的發(fā)展[J].湖南檔案,2007.
看過《檔案數(shù)字化解決方案范文三篇》的人還看了以下文章