SỐ HÓA TÀI LIỆU LƯU TRỮ VÀ QUY TRÌNH SỐ HÓA TÀI LIỆU


I. ĐẶC ĐIỂM TÀI LIỆU SỐ HÓA
1. Khái quát chung
Trong những năm gần đây, một trong những biện pháp quản lý tài liệu lưu trữ đã được nhắc đến nhiều nhất  là số hóa tài liệu và trong xã hội đã manh nha thị trường các dịch vụ số hóa tài liệu lưu trữ. Luật lưu trữ do Quốc hội thông qua ngày 11/11/2011 đã quy định về tài liệu lưu trữ điện tử, không quy định chi tiết đến tài liệu lưu trữ số hóa.
Chúng ta có thể hiểu tóm tắt tài liệu điện tử là một bản ghi được tạo ra, gửi, chuyển giao, nhận được, hoặc lưu trữ, sử dụng bằng phương tiện điện tử. Tài liệu điện tử được hình thành từ hai nguồn chính:
- Bản ghi các thông diệp dữ liệu được khởi tạo từ đầu.
- Bản ghi các dữ liệu số từ tài liệu truyền thống.
Vi vậy tài liệu số hóa có nguồn gốc từ tài liệu điện tử, nhưng không đồng nhất với tài liệu điện tử. Tài liệu số hóa trở thành tài liệu điện tử qua quá trình số hóa dữ liệu. Đây là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số. Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu là quá trình chuyển các dạng dữ liệu truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết.





2. Mục tiêu của việc số hóa tài liệu lưu trữ
Thông qua các công việc cụ thể của việc số hóa dữ liệu, chúng ta mong muốn đạt được các mục đich là xử lý các quy trình nghiệp vụ lưu trữ được tối ưu. Muốn đạt được những mục tiêu đó, các kho lưu trữ phải thực hiện các thao tác thuộc quy trình số hóa tài liệu là chuyển đổi tài liệu lưu trữ dạng thông thường, vẫn quen gọi là tài liệu có “tín hiệu tương tự” (analog) sang dạng tài liệu số, hoặc dữ liệu số (digital). Từ đó, chúng ta đạt được những mục tiêu cơ bản như:
a) Đồng nhất các loại hình tài liệu
Với phương pháp quản lý tài liệu lưu trữ truyền thống, chúng ta phải bảo quản tài liệu với các vật mang tin của từng loại hình tài liệu lưu trữ riêng, như: tài liệu giấy, tài liệu phim ảnh, phim điện ảnh, tài liệu ghi âm..., vì các chế độ bảo quản tài liệu như chế độ nhiệt độ, độ ẩm, ánh sáng khác nhau; hoặc thiết bị phục vụ khai thác, sử dụng từng tài liệu đó cũng khác nhau. Nhưng với dữ liệu số, chúng ta đã loại trừ được hầu hết sự khác biệt đó, tạo thuận lợi cho người sử dụng.
b) Quản lý, khai thác tập trung
Cùng với sự tối ưu đã phân tích trên, đương nhiên, toàn bộ các dữ liệu số hóa, không phân biệt chúng có nguồn gốc từ tài liệu có vật mang tin gì, đều có thể quản lý trong một cơ sở dữ liệu, tạo sự tối ưu cho người sử dụng. Thông qua việc số hóa tài liệu lưu trữ, độc giả không phụ thuộc vào các kho bảo quản riêng biệt tài liệu lưu trữ khác nhau, và không phải gắn mình vào một không gian nhất định của một phòng đọc khi khai thác, sử dụng tài liệu lưu trữ. Từ đó, các cơ quan lưu trữ có thể tạo cho độc giả tăng khả năng tiếp cận, sử dụng tài liệu được nhanh chóng, chính xác và tiện lợi.
c) Kéo dài tuổi thọ của tài liệu lưu trữ bản gốc.
Đây cũng chính là giải pháp của quy trình bảo quản và bảo hiểm tài liệu lưu trữ mà bấy lâu, cơ quan quản lý ngành lưu trữ vẫn đang trăn trở.
3. Thuận lợi và khó khăn khi số hóa tài liệu lưu trữ
Khi đặt yêu cầu số hóa tài liệu lưu trữ, cũng không nên tuyệt đối hóa một chiều về sự tối ưu của chúng, để chúng ta biết trước các điều kiện nào cần có, để có thể xây dựng được một đề án số hóa tài liệu lưu trữ cho cơ quan mình. Với mục tiêu được đặt ra, ta cần biết được chi tiết những ưu điểm và hạn chế của dữ liệu số hóa.
a) Ưu điểm là:
- Giúp việc lưu trữ, truy xuất, chia sẻ, tìm kiếm thông tin một cách dễ dàng. Ưu điểm này bao gồm tổng hoà các thuận tiện trong công tác quản lý, bảo quản, bảo vệ, khai thác và sử dụng tài liệu lưu trữ với một ngân hàng dữ liệu số;
- Linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau. Sự chuyển đổi phổ biến nhất là chuyển đổi định dạng các file tài liệu. Ví dụ, ta đang có một file word, có thể chuyển sang định dạng PDF nhờ một chương trình ứng dụng để chuyển đổi nó. Ứng dụng đó có thể là một chương trình độc lập, hoặc là một kỹ thuật nhúng tích hợp vào chương trình word, hoặc là một ứng dụng on line...Dữ liệu sau khi chuyển đổi sẽ được sử dụng linh hoạt hơn.
- Giảm chi phí tối đa cho việc quản lý tài liệu lưu trữ. Chúng ta hiểu tiết kiệm không gian bảo quản tài liệu lưu trữ một cách tương đối, vì theo quy định của Luật lưu trữ, tài liệu lưu trữ đã được số hóa, vẫn phải bảo quản an toàn tài liệu bản gốc.
- Có khả năng chỉnh sửa và tái sử dụng dữ liệu. Ở thuận lợi này ta cần hiểu “khả năng chỉnh sửa” theo đúng nguyên tắc quản lý tài liệu lưu trữ là không được chỉnh sửa nội dung tài liệu, mà chỉ chỉnh sửa chất lượng mang tin, như tài liệu bị mờ, bị hư hỏng nặng cần chỉnh sửa...
b) Những hạn chế cần khắc phục của tài liệu số hóa là:
- Khi bắt đầu xây dựng một đề án số hóa tài liệu lưu trữ, cần phải đầu tư ban đầu về công nghệ, cơ sở hạ tầng công nghệ thông tin và các thiết bị khác, ví dụ, cần phải đầu tư mua sắm, hoặc thuê từng phần các thiết bị phần cứng như máy tính, máy in, máy quét ảnh và các chương trình phần mềm để quản lý và tra tìm tài liệu. Khi đã có đầy đủ các thiết bị phần cứng, phần mềm, việc thực hiện số hóa tài liệu có thể thuê các cơ quan chuyên môn thực hiện. Ngoài ra, điều rất quan trọng là phải đầu tư cho yêu cầu đào tạo con người theo các mức độ khác nhau như đào tạo công chức làm quản lý, công chức, viên chức tác nghiệp và những cán bộ kỹ thuật, cán bộ chuyên tin.
- Bất tiện thứ hai là dữ liệu số hóa dễ bị sao chép và sửa đổi trái phép. Điều này có thể khắc phục giản đơn đối với những người chuyên làm công tác quản trị mạng, nhưng không giản đơn đối với toàn bộ công chức, viên chức của cả một cơ quan, tổ chức có sử dụng cơ sở dữ liệu số hóa. Với phương pháp bảo vệ dữ liệu ở ba cấp: cấp mạng, cấp cơ sở dữ liệu và cấp người sử dụng, người ta có thể loại trừ được sự bất tiện này. Nhưng một cơ quan đông người, rất khó có thể quản lý được từng người ở từng cấp. Ví dụ, cấp độ 3 là bảo vệ dữ liệu ở người sử dụng, một số người trong cơ quan tổ chức được quyền miễn trừ nguyên tắc này để họ có đủ quyền, kể quyền quản trị cơ sở dữ liệu. Nhưng chính một số cá nhân có quyền quản trị mạng lại sao chép cho riêng mình toàn bộ cơ sở dữ liệu thì sao (?)...
- Khó khăn thừ ba, cũng như đã đề cập một phần ở phần viết trên là, việc triển khai sử dụng cơ sở dữ liệu số hóa phải đào tạo đồng bộ và có hệ thống để tất cả cán bộ công chức, viên chức của cơ quan, tổ chức đều có thể sử dụng được tài liệu số đúng phương pháp và nguyên tắc.
- Một khó khăn có liên qua đến vấn đề đã nêu, là chế độ bảo mật dữ liệu. Thông thường, tài liệu còn chế độ mật thì chưa được số hóa. Nhưng sự phân biệt giữa tài mật và không mật chỉ là tương đổi. Nhiều tài liệu được sử dụng rộng rãi, nhưng qua diễn biến xã hội ở trong nước và quan hệ quốc tế, tài liệu đó có thể phục hồi độ mật. Vì vậy, trong một sơ sở dữ liệu, có thể không bị mất dữ liệu, hoặc không bị sao chép, nhưng bị lộ thông tin tài liệu mật.
II. QUY TRÌNH SỐ HÓA TÀI LIỆU
Do mục tiêu số hóa tài liệu khác nhau, mà có thể đặt ra các bước số hóa tài liệu khác nhau phù hợp đối với từng cơ quan, tổ chức. Cục Văn tthư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu lưu trữ chỉ giản đơn có 5 bước là:



(Quy trình số hóa tài liệu )


Bước 1. Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa. Việc lựa chọn này là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu trữ. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, thì tài liệu được chọn phải là tài liệu thuộc diện quý, hiếm theo quy định của pháp luật.
Bước 2. Chuẩn bị tài liệu. Công việc bao gồm:
- Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu; Phân loại TL, tách riêng những TL rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ thuật scan từng tờ tài liệu. Nếu việc số hóa các tư liệu lưu trữ dạng đóng quyển, thì có thể áp dụng công nghệ mới tiến bộ hơn như Bookscan cho việc số hóa tài liệu lưu trữ.
Bước 3. Scan và thiết lập hệ thống ảnh; đặt tên file; đặt định dạng; đóng, ghim lại theo tổ chức tài liệu ban đầu, tạo siêu dữ liệu (metadata)
Đây là bước quyết định nhất để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được lập và nhúng (gắn) và tài liệu thông qua một phần mềm ứng dụng và tạo ra metadata. Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước.
Bước 4. Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh không đạt yêu cầu.
Bước 5. Nghiệm thu, bàn giao tài liệu lưu trữ.
Công việc bao gồm bàn giao tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa là tài liệu lưu trữ của một Lưu trữ lich sử thì với những văn bản không đóng quyển trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để bảo đảm đầy đủ như tài liệu ban đầu đã nhận ở bước 1.

Nhận xét