所謂數(shù)據(jù)著錄服務(wù),是指根據(jù)用戶的需求情況,將那些紙質(zhì)或無法OCR識別的內(nèi)容,通過人工著錄的方式,將其轉(zhuǎn)變計算機(jī)系統(tǒng)數(shù)據(jù)庫中條目數(shù)據(jù),以便軟件系統(tǒng)查詢利用。
由于現(xiàn)今使用的軟件系統(tǒng)五花八門,不同行業(yè)、不同應(yīng)用所需要的數(shù)據(jù)類型和字段的數(shù)量不盡相同,因此給數(shù)據(jù)的提取工作帶來了很大的不便。我公司提供的數(shù)據(jù)著錄服務(wù)分類,主要參考著錄字段項的數(shù)量、數(shù)據(jù)著錄的提取方式和提交方式。
- 著錄字段項的數(shù)量:
著錄字段項的數(shù)量不同,著錄一條目錄數(shù)據(jù)所需的時間不同,因此,所需的人力和時間成本不同。一般情況下,檔案的條目結(jié)構(gòu)所需著錄的字段數(shù)量在10個字段左右。
- 著錄數(shù)據(jù)的提交方式:
所謂提交方式,是指根據(jù)客戶方使用的軟件系統(tǒng)的情況,包括基于B/S架構(gòu),基于C/S架構(gòu)和單機(jī)形式的軟件系統(tǒng),不同系統(tǒng)所要求的數(shù)據(jù)提交方式不同。比如說基于B/S架構(gòu)的軟件系統(tǒng),數(shù)據(jù)著錄主要采用網(wǎng)頁方式進(jìn)行著錄,因此,每著錄一條數(shù)據(jù)所需的時間受到網(wǎng)絡(luò),乃至服務(wù)器端軟件平臺的限制,著錄時間并提交數(shù)據(jù)的時間較長,而基于C/S架構(gòu)和單機(jī)形式的軟件系統(tǒng)則不存在這樣的問題。另外,有些軟件系統(tǒng)提供數(shù)據(jù)導(dǎo)入功能,這樣,數(shù)據(jù)著錄人員可以將數(shù)據(jù)著錄到本地(如Excel、Word、 Acces)文件中,然后統(tǒng)計進(jìn)行質(zhì)檢,并批量將數(shù)據(jù)導(dǎo)入到系統(tǒng)之中,這樣大大提高了著錄速度,減小了數(shù)據(jù)著錄的成本。
- 著錄數(shù)據(jù)的提取方式:
所謂提取方式,是指根據(jù)紙質(zhì)數(shù)據(jù)的情況,著錄人員將以何種形式進(jìn)行數(shù)據(jù)讀取。比如說著錄人員只需按照現(xiàn)有的紙質(zhì)目錄進(jìn)行錄入,還是根據(jù)紙質(zhì)數(shù)據(jù)的邏輯信息,從文本內(nèi)容中提取專業(yè)的信息,著錄到軟件系統(tǒng)中。不同的著錄方式所需時間代價和著錄成本不同。