- HienDai.JSC
Mười thách thức trong Xây dựng thư viện số hiệu quả
Các nhân viên của Chương Trình Thư Viện Số Quốc Gia tại Thư Viện Quốc Hội Mỹ đã chỉ ra mười thách thức phải đối diện khi xây dựng một thư viện số lớn và hiệu quả trong thế kỷ 21
 Trong một số trường hợp, không có giải pháp công nghệ cho thách thức này, nhưng thông qua việc chia sẻ các ý tưởng, những tư duy mới có thể xuất hiện để giúp các tổ chức như TVQH Mỹ xây dựng các chính sách cho những vấn đề quan trọng. Các thách thức có thể được nhóm theo những chuyên đề lớn: xây dựng nguồn tài nguyên, tích hợp, sở hữu trí tuệ, cung cấp truy cập hiệu quả, và duy trì các nguồn tài nguyên. TVQH Mỹ hy vọng rằng các tư duy sáng tạo và đổi mới có thể đưa ra các giải pháp cho những thách thức này.
XÂY DỰNG NGUỒN TÀI NGUYÊN
Thách thức số 1:Phát triển các công nghệ tiến bộ cho việc số hóa các tài liệu tương tự.
Để xây dựng một nguồn tài nguyên toàn diện, các tài liệu trong lịch sử hiện tồn tại dưới dạng tương tự (ví dụ: sách, tạp chí, hồ sơ phòng thí nghiệm, bản ghi âm, bản thảo, hình ảnh) cần phải được chuyển đổi. Ngày nay, công nghệ chuyển đổi kỹ thuật số là, ở mức tốt nhất, xuất hiện và thường buộc một thư viện phải lựa chọn giữa rủi ro thiệt hại cho bản gốc quý hoặc sản xuất các bản sao chất lượng cao nhất. Có rất ít các tiêu chuẩn được thành lập hoặc thực hành tốt nhất và thiếu các công cụ với mục tiêu đo lường chất lượng tái tạo. Có một nhu cầu hỗ trợ tự động hơn nữa để chụp hình trong cấu trúc dữ liệu rõ ràng các manh mối dẫn đường và tổ chức tiềm ẩn trong tác phẩm in thông qua số trang, mục lục, và chỉ số.
Thách thức số 2: Thiết kế các công cụ tìm kiếm và thu hoạch bù đắp cho những thông tin mô tả tóm lược hoặc không hoàn thiện.
Cung cấp truy cập đến các bộ sưu tập của thư viện là việc tốn nhân lực. Để sử dụng các nguồn lực hạn chế cho việc số hóa khối lượng đáng kể nội dung, nó thường là điều cần thiết để giảm mức độ chi tiết được cung cấp trong mục lục và các chỉ mục kèm theo. Các công cụ tự động có thể cho phép sự kết hợp kiến thức thực tế (ví dụ nước Pháp ở Châu Âu, Leontyne Price là một ca sĩ opera) với thông tin mô tả, chỉ mục, hoặc các hệ thống tìm kiếm thu hồi?. Các cơ quan kiến thức thực tế có thể chia sẻ hoặc lắp ráp hợp tác và phân phối?.
Thách thức số 3: Thiết kế các công cụ tạo điều kiện tăng cường biên mục hoặc thông tin mô tả bằng cách kết hợp với sự đóng góp của người sử dụng.
Thư viện kỹ thuật số có thể tận dụng lợi thế của các chuyên gia phân tán (ở nhiều nơi)? Trong số hàng triệu người dùng, sẽ có những người có thể nâng cao các mô tả hoặc biên mục của một đầu mục, do đó cải thiện cơ hội các nhà nghiên cứu tiếp theo trong việc tìm kiếm nó. Công cụ hợp tác có thể cho phép các đồng nghiệp chuyên nghiệp xa xôi, ví dụ, giảng viên hoặc sinh viên tốt nghiệp trong các trường đại học của quốc gia, cung cấp những cải tiến tuyệt vời cho các tài liệu mà họ sử dụng cho những nghiên cứu tiên tiến của mình. Ít người sử dụng ít chuyên nghiệp hơn (học sinh quen thuộc với các tòa nhà trong hình ảnh, hoặc cá nhân nhận một thành viên gia đình trong một hình ảnh nhóm) cũng có thể thêm giá trị cho các tài nguyên. Những bộ lọc, phương thức cải tiến quy chiếu nào mà không vi phạm quyền riêng tư, hoặc bảo vệ khác chặn việc lạm dụng có thể hỗ trợ tăng cường này của tài nguyên?.
KHẢ NĂNG TƯƠNG TÁC
Thách thức số 4: Thiết lập các giao thức và tiêu chuẩn tạo điều kiện thuận lợi cho việc lắp ráp các thư viện số phân tán.
Làm thế nào một nguồn tài nguyên phân tán như Thư Viện Số Quốc Gia có thể được lắp ghép để tạo nên một sự thống nhất ảo?. Những loại giao thức và mức độ tiêu chuẩn hóa trên các loại đối tượng kỹ thuật số nào sẽ đạt được một sự cân bằng giữa tính khả thi của việc thực hiện rộng rãi và thống nhất của truy cập?. Nên thống nhất tìm kiếm sử dụng một cách tiếp cận như được tìm thấy trong các tiêu chuẩn Z39.50 (tìm kiếm phân tán) hoặc các phương pháp được sử dụng bởi công cụ tìm kiếm Wide Web Thế giới (lập chỉ mục phân tán)?. Làm thế nào có thể phân phối các thư viện kỹ thuật số tốt nhất bảo vệ các quyền liên quan đến nội dung (bao gồm cả quyền riêng tư và các điều kiện áp đặt bởi các nhà tài trợ cũng như bản quyền) trong khi vẫn cung cấp các truy cập rộng nhất có thể?.
SỞ HỮU TRÍ TUỆ
Thách thức số 5: Đánh địa chỉ mối quan tâm pháp lý liên quan đến truy cập, sao chép và phổ biến các tài liệu vật lý và kỹ thuật số.
Một yếu tố quan trọng cho các thư viện kỹ thuật số là sự công nhận phù hợp và bảo vệ quyền lợi hợp pháp như bản quyền, công khai, bảo mật, vấn đề khiêu dâm, phỉ báng bảo vệ sở hữu trí tuệ cũng như mối quan tâm ít tính pháp lý nhưng nghiêm trọng liên quan đến đạo đức chia sẻ, cung cấp quyền truy cập vào dân gian hoặc tài liệu dân tộc học. Tầm nhìn cho các thư viện kỹ thuật số bao gồm tính dễ thay đổi, dễ dàng truy cập vào nhiều loại vật liệu. Điều này thường xung đột với các nhiệm vụ được giao phó của thư viện và lưu trữ là chăm sóc và quản lý tài liệu đó có thể là đối tượng của quyền riêng tư hoặc các nhu cầu khác về an ninh.
Những nỗ lực để xây dựng thư viện kỹ thuật số sẽ bị chậm trễ hoặc thất vọng khi không có một khuôn khổ trách nhiệm chung, về quyền, cấp phép, và hạn chế để thừa nhận các nhu cầu lẫn nhau về quyền sở hữu và người sử dụng tài liệu trong thư viện kỹ thuật số. Thách thức ở đây là, một mặt, xây dựng cơ chế, có lẽ kỳ vọng xã hội độc lập hoặc kết hợp với các phương tiện kỹ thuật, đối với mức độ truy cập chấp nhận được (ví dụ như khi quyền riêng tư là vấn đề) và sử dụng (chẳng hạn như mức độ hoặc cho phép sao chép và phổ biến). Có thể thực hành trách nhiệm bao gồm các chính sách chấp nhận sử dụng, các quy trình, và các hợp đồng tiêu chuẩn bắt đầu thiết lập các chuẩn mực về hành vi của những người tạo ra và sử dụng tài nguyên thư viện kỹ thuật số?. Làm thế nào có thể tác giả, nhà sáng chế, nhà nghiên cứu, các nhà xuất bản (những người có thể yêu cầu một số kiểm soát như thế nào thông tin được làm sẵn có hoặc sử dụng) và các thư viện kỹ thuật số phát triển phương tiện hợp lý để duy trì quản lý phù hợp, không chỉ tập trung vào công việc trong lĩnh vực công cộng (hoặc hạng mục không khác với việc bảo vệ pháp lý)?.
Tài liệu hiện có trên Internet từ các bộ sưu tập Lịch sử nước Mỹ có phạm vi từ các đầu mục mà thư viện không biết gì về bản quyền hoặc vấn đề pháp lý khác đến nội dung có sự cho phép đã được tìm kiếm từ quyền tác giả hoặc chủ sở hữu quyền khác để đưa vào trang web của Thư viện. Tài liệu sử nước Mỹ cũng bao gồm một loạt các phương tiện truyền thông như văn bản in, hình ảnh, bản in, bản ghi âm, và bộ phim. Ứng viên được khuyến khích khám phá những thách thức kỹ thuật hơn trong bối cảnh của vấn đề pháp lý và cẩn thận xem xét các "tuyên bố truy cập" cũng như bản quyền và tuyên bố hạn chế trên trang chủ sử nước Mỹ và trên hầu hết các trang chủ của bộ sưu tập. Lưu ý rằng các thư viện không thể cung cấp tư vấn pháp lý cho các ứng viên về nội dung của các bộ sưu tập ngoài các tuyên bố đó.
TRUY CẬP HIỆU QUẢ
Thách thức số 6: Tích hợp truy cập tới cả nội dung vật lý và nội dung số
Một người sử dụng tìm kiếm một đầu mục trong một mục lục thư viện sẽ có thể nhận ra nó mà không quan tâm đến việc liệu nó có sẵn trong hình thức vật lý ban đầu của nó hoặc là một sinh sản kỹ thuật số hoặc vi phim. Đặc tả trí tuệ của bản gốc và bản sao cần được trình bày một cách tích hợp đầy đủ. Trong thời gian thử nghiệm hiện tại, tuy nhiên, nhiều nỗ lực số hóa được ngắt kết nối từ dịch vụ thư viện truyền thống. Ngay cả khi các biểu ghi thư mục thích hợp tồn tại, nội dung kỹ thuật số có thể không kết nối được người dùng tiềm năng bởi vì các đầu mục riêng lẻ trong bộ sưu tập kỹ thuật số không thể được lấy trực tiếp hoặc không được xác định một cách hợp lý để hỗ trợ các liên kết từ danh mục sản phẩm truyền thống hoặc chỉ số thư mục.
Thách thức số 7: Xây dựng phương pháp tiếp cận có thể trình bày các nguồn tài nguyên không đồng nhất một cách chặt chẽ.
Một thư viện kỹ thuật số cung cấp các nội dung đa dạng sẽ được đặc trưng bởi tính không đồng nhất trong định dạng ban đầu, trong định dạng kỹ thuật số và độ phân giải, và trong mức độ chi tiết và định dạng của thông tin mô tả mà có sẵn để hỗ trợ truy cập. Không đồng nhất này có thể được nhìn thấy trong các bộ sưu tập lịch sử trên mạng tại Thư viện Quốc hội, trong đó tiêu biểu cho các lớp lớn hơn của tài liệu có khả năng tạo thành một phần của bất kỳ thư viện kỹ thuật số nào. Chương trình Thư viện kỹ thuật số Quốc gia cung cấp bao gồm sách, bài báo, tờ rơi, giấy tờ cá nhân, văn bản pháp luật, bản in, bản vẽ kiến ​​trúc, hình ảnh, bản đồ, bản nhạc, bản ghi âm, và phim ảnh. Một số tài liệu văn bản đã được tái nhập và đánh dấu trong Standard General Markup Language (SGML), một số được thu lại như ánh xạ bit hình ảnh, và một số có sẵn trong cả hai hình thức. Hình ảnh bằng hình ảnh đã được chụp ở độ phân giải khác nhau. Một số bộ sưu tập có mục lục hoặc chỉ mục chi tiết, trong khi những bộ khác được mô tả một cách ngắn gọn và hời hợt. Thư viện Quốc hội đang xây dựng một kho lưu trữ chung chung mà có thể lưu trữ các đối tượng trong định dạng bất kỳ, và đại diện cho mối quan hệ giữa các đối tượng, chẳng hạn như một chuỗi các trang-hình ảnh tạo thành một cuốn sách, mà cũng có thể được sao chép và đánh dấu lên trong SGML.
Khi đối mặt với sự đa dạng lớn về nội dung và mô tả, vấn đề đặc biệt chú ý đến sự phát triển của một cách tiếp cận thống nhất để lập chỉ mục và trình bày kết quả thu hồi. Điều quan trọng là cách tiếp cận bất kỳ cho phép tất cả các thông tin có sẵn được sử dụng để hỗ trợ phục hồi chứ không phải là buộc người dùng muốn tìm kiếm trên toàn bộ nguồn tài nguyên phải dựa trên một số mẫu số chung nhỏ nhất của thông tin mô tả.
Thách thức số 8: Làm cho thư viện kỹ thuật số Quốc Gia hữu ích cho các cộng đồng khác nhau và cho các mục đích khác nhau.
Có bao nhiêu cách khác nhau để người dùng có thể tìm hiểu và khám phá nội dung? Những khả năng gì sẽ cho phép người dùng tùy biến giao diện và xác định sở thích có ảnh hưởng đến kết quả thu hồi? Giáo viên sẽ được hưởng lợi từ các công cụ hỗ trợ cho nhóm các dự án hoặc cộng tác với các đồng nghiệp?. Những công cụ này có thể được phát triển bởi ai? Làm thế nào sự khác biệt về từ vựng có thể được giải quyết? Ví dụ, làm thế nào một giao diện có thể dịch các thuật ngữ tìm kiếm được lựa chọn bởi người dùng ngày nay sang ngôn ngữ của các tài liệu lịch sử cũ? Làm thế nào có thể từ vựng của, nói, giáo viên tìm kiếm tài liệu để minh họa cho chủ đề rộng lớn trong một chương trình giảng dạy theo quy định được ánh xạ tới các từ vựng của các biên mục viên mô tả các đầu mục riêng lẻ?
Thách thức số 9: Cung cấp các công cụ hiệu quả hơn và linh hoạt hơn cho việc chuyển đổi nội dung kỹ thuật số cho phù hợp với nhu cầu của người dùng cuối.
Ngày nay, mỗi mục nội dung trong hầu hết các thư viện kỹ thuật số được thể hiện trong nhiều hình thức hoặc các phiên bản. Đa hình thức tồn tại để phục vụ sự đa dạng của người sử dụng, chức năng như làm chủ lưu trữ, và giảm thời gian tải về và tải truyền trên mạng. Một nhà cung cấp nội dung có thể sản xuất phiên bản lớn và nhỏ của hình ảnh, phiên bản nén và giải nén của hình ảnh, văn bản, âm thanh, video, văn bản định dạng cho phần mềm trình duyệt và cũng được định dạng để bảo quản hoặc xuất bản và các tài liệu cả trong định dạng độc quyền và công khai hoặc định dạng "mở ". Gánh nặng này kết quả duy trì sản xuất số nhiều và từ thực tế là ngày nay nhiều đối tượng số rất khó để chuyển đổi nhanh chóng. Những gì công nghệ có thể được phát triển để làm cho đối tượng số mềm dẻo, dễ di chuyển, có thể biến dạng? Khả năng tương tự cũng là cần thiết để đảm bảo duy trì các nội dung kỹ thuật số cho hậu thế.
DUY TRÌ TÀI NGUYÊN
Thách thức số 10: Phát triển một mô hình kinh tế cho sự hỗ trợ của Thư Viện Số Quốc Gia.
Việc tạo ra và duy trì thư viện kỹ thuật số là rất tốn kém. Phát sinh chi phí cho sản xuất, để cung cấp truy cập liên tục, và bảo quản các thông tin kỹ thuật số. Chi phí phát triển và vận hành một kiến trúc phân phối cho lưu trữ lâu dài, di chuyển, và sao lưu các tài liệu kỹ thuật số sẽ cao. Kể từ khi tài nguyên được phân phối giữa các nhà cung cấp, chi phí ròng có xu hướng được cải trang. Thư viện sẽ được hưởng lợi từ các ước tính tốt hơn về chi phí và các xu hướng trong chi phí sản xuất và duy trì một ngữ liệu thông tin kỹ thuật số.
KIPOS - Giải pháp đầu tiên ứng dụng METS
METS - Metadata Encoding & Transmission Standard là tiêu chuẩn cho thư viện số hiện đại, là cuộc cách mạng về công nghệ quản lý nội dung số trong thư viện ngày nay.