680 likes | 905 Views
GREENSTONE. www.greenstone.org. Nội dung. Tổng quan Greenstone DublinCore Cấu trúc một bộ sưu tập File cấu hình Bộ sưu tập Plugin Classifier Định dạng cách hiển thị tài liệu (Danh sách tài liệu, thành phần của trang web hiển thị) Điều chỉnh giao diện
E N D
GREENSTONE www.greenstone.org
Nội dung • Tổng quan Greenstone • DublinCore • Cấu trúc một bộ sưu tập • File cấu hình Bộ sưu tập • Plugin • Classifier • Định dạng cách hiển thị tài liệu (Danh sách tài liệu, thành phần của trang web hiển thị) • Điều chỉnh giao diện • Điều chỉnh cấu trúc: Search Indexes; …
Giới thiệu • Một vấn đề rất quan trọng trong việc tạo, tổ chức và cung cấp việc truy cập đến các bộ sưu tập thư viện số là phần mềm được sử dụng cho mục đích này • Một phần mềm thích hợp là chìa khóa cho sự thành công của việc xây dựng và khai thác thư viện số.
Tổng quan về Greenstone • Greenstone là bộ phần mềm miễn phí cho việc xây dựng và phân phối bộ sưu tập thư viện số. Nó cung cấp phương pháp mới để tổ chức thông tin và xuất bản thông tin trên internet hay trên CD ROM Greenstone xuất phát từ Dự án Thư viện Số của New Zealand tại trường ĐH Waikato, Và được phát triển và phân phối bởi sự hợp tác Với UNESCO và Human Info NGO Greenstone là phần mềm mã nguồn mở (Open source). Mục đích là cung cấp cho các trường ĐH, thư viện Và các viện nghiên cứu xây dựng các bộ sưu tập cho riêng mình
Greenstone xuất phát từ Dự án Thư viện số của New Zealand tại trường ĐH Waikato, • Và được phát triển và phân phối bởi sự hợp tác với UNESCO và Human Info NGO
Greenstone là phần mềm mã nguồn mở (Open source). • Mục đích là cung cấp cho các trường ĐH, thư viện và các viện nghiên cứu xây dựng các bộ sưu tập cho riêng mình
Tổng quan Những đặc điểm được cung cấp bởi Greenstone • Multiplatform: Windows (bất kỳ version nào), Linux, Sun Solaris, and Mac Osx. • Truy cập và phân phối: Bộ sưu tập Greenstone có thể được chia sẻ trên Internet hay xuất ra CD ROM và truy cập từ CD hay từ máy cục bộ mà không cần nối Internet • Xây dựng Bộ sưu tập: hỗ trợ nhiều cách khác nhau để xây dựng bộ sưu tập
Tổng quan (tt.) • Những người phát triển Greenstone có thể hưởng lợi từ các đặc tính được hỗ trợ bởi phần mềm, như là chạy trên nhiều hệ điều hành khác nhau (multiplatform), truy cập theo nhiều cách khác nhau, quản lý được nhiều kiểu file khác nhau và phát triển nhiều ngôn ngữ khác nhau • Greenstone có phương pháp làm chỉ mục (indexing) và tìm kiếm (search) rất mạnh • Người sử dụng Greenstone có thể thay đổi giao diện phù hợp với người dùng
Công cụ đánh chỉ mục mạnh: Có thể indexing từ văn bản toàn văn hoặc từ các trường Metadata • Công cụ tìm kiếm mạnh với nhiều cách khác nhau • Dạng file: Xử lý được nhiều dạng files khác nhau: HTML, PDF, DOC, Email, PPT, JPG, …
Bài tập 1 • Làm quen với một số bộ sưu tập Greenstone - Tìm theo từ, ngữ - Sử dụng toán tử khi tìm kiếm - Duyệt theo chủ đề
Bài tập 2 • Thảo luận về cấu trúc Bộ sưu tập cho khóa học SIDA • Gồm bao nhiêu bộ sưu tập. Cấu trúc bộ sưu tập, loại file của bộ sưu tập • Phân công người chịu trách nhiệm từng bộ sưu tập. Thống nhất cách chọn tài liệu và định chủ đề cho mỗi BST • Lịch thực hiện.
Cài đặt Greenstone • Download từ nguồn: www.greenstone.org • Yêu cầu hệ thống: - 50 MB đĩa cứng (HDD) còn trống chỗ - Cài Java version 1.4 trở lên - Cài ImageMagick - Cài Greenstone
Bài tập 3 • Cài đặt Greenstone. • Ngôn ngữ
XÂY DỰNG BỘ SƯU TẬP TRONG GLI • Gather: chọn lọc tài liệu cho BST • Enrich: Biên mục, thêm thẻ Metadata • Design: cấu trúc lại Bộ sưu tập • Create: xây dựng bộ sưu tập • Format: lệnh trình bày tài liệu
Tạo bộ sưu tập bằng Greenstone Library Interface (GLI) Bước 1 Khởi động chức năng GLI - Start/ Program/ Greenstone/Greenstone Librarian Interface - Tạo bộ sưu tập mới: Gõ tên và mô tả tóm tắt
Bước 2 Chọn tài liệu cần tạo bộ sưu tập - Bấm Gather/ Mở đến địa chỉ chứa tài liệu - Kéo và thả vào cửa sổ bên phải
Bước 3: Biên mục cho từng tài liệu đưa vào theo chuẩn Dublin core - Bấm vào Enrich/ Chọn file tương ứng rồi biên mục theo 15 trường của Dubline core
Bước 4 Xây dựng bộ sưu tập - Create/ Build collection
Bài tập 4 • Xây dựng 1 BST gồm các trang HTML. Step 1: Khởi động chương trình GLI Step 2: Tạo 1 BST mới. File/ New Step 3: Gather. Vào thư mục C:\DATA\, chọn các file HTML để làm BST Step 4: Build BST • Mục đích: - Làm quen với 2 công cụ Gather & Creator - Vào Enrich, kiểm tra khả năng extract của Greenstone - Thử tìm kiếm sau khi BST đã được tạo ra (Build)
Bài tập 5 – Tạo BST với Word hoặc PDF files Step 1: Tạo BST mới với GLI: đặt tên BST, mô tả về BST, … Step 2: Chon (gather) tài liệu cần làm BST. Vào C:\DATA\PDF Step 3: Create/ Build BST Xem khả năng extract của greenstone đối với loại file pdf, thử công cụ tìm kiếm và nhận xét
Cấu trúc Bộ sưu tập Tên Bộ Sưu tập Archives Building etc Images Import Index Perllib
Archives: Chứa các tập tin khi import • Building: Chứa các tập tin trong quá trình nén, tạo chỉ mục, tạo CSDL • etc: chứa tập tin cấu hình collect.cfg • Images: chứa hình ảnh của Bộ sưu tập • Index: chứa tập tin sau nén, tạo chỉ mục • Perllib: chứa thư viện Perl hỗ trợ cho BST
Cấu trúc file cấu hình bst (collect.cfg) creator ihw@cs.waikato.ac.nz maintainer ihw@cs.waikato.ac.nz public true buildtype mgpp #indexes document:text document:Title document:Source indexes text Title Source defaultindex text levels document indexoptions accentfold casefold stem defaultlevel document plugin ZIPPlug plugin GAPlug plugin TEXTPlug plugin HTMLPlug -smart_block plugin EMAILPlug plugin PDFPlug plugin RTFPlug plugin WordPlug plugin PSPlug
classify AZList -metadata Title classify AZList -metadata Source format VList "<td valign=\"top\">[link][icon][/link]</td> <td valign=\"top\">[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td> <td valign=\"top\">[highlight] {Or}{[dc.Title],[exp.Title],[ex.Title],Untitled} [/highlight]{If}{[ex.Source],<br><i>([ex.Source])</i>}</td>" format HList "[link][highlight][ex.Title][/highlight][/link]" format DocumentHeading "{Or}{[parent(Top):Title],[Title],untitled}<br>" format DocumentText "[Text]" format DocumentButtons "Detach|Highlight" format SearchTypes "plain,form" collectionmeta collectionname [l=vi] "MCSA" collectionmeta collectionextra [l=vi] "Tai lieu MCSA" collectionmeta .document:text [l=vi] "text" collectionmeta .document:Title [l=vi] "titles" collectionmeta .document:Source [l=vi] "filenames" collectionmeta .text [l=vi] "text" collectionmeta .Title [l=vi] "titles" collectionmeta .Source [l=vi] "filenames"
Plugin • Plugin là một chương trình con được dùng trong quá trình xây dựng bộ sưu tập • Nhiều dạng tài liệu khác nhau: word, pdf, img, html, …cần plugin để chuyển về dạng thống nhất là XML • Tùy thuộc nguồn tài liệu, cần plugin tương ứng
Ví dụ về plug in • Chèn 1 file tài liệu dạng *.ppt, xem thông báo
DUBLIN CORE METADATA TITLE: tên đặt cho nguồn lực bởi NGƯỜI TẠO hoặc NHÀ XUẤT BẢN – tên phổ biến của nguồn lực CREATOR: Người hoặc tổ chức chịu trách nhiệm chính về nội dung trí tuệ của tài nguyên – hỏi “Ai tạo ra tài nguyên này?” SUBJECT: Chủ đề của nguồn lực, từ khoá, câu, hoặc các mô tả phân loại miêu tả chủ đề hoặc nội dung của nguồn lực – từ khoá, cụm từ khoá, hoặc mã phân loại có thể được dùng – việc dùng các từ vựng được kiểm soát rất quan trọng
DESCRIPTION: Mô tả nội dung của tài nguyên, bao gồm các tóm tắt trong trường hợp của tài liệu-hướng đối tượng hoặc mô tả nội dung trong trường hợp tài nguyên ảo PUBLISHER: chịu trách nhiệm toàn bộ cho việc tạo nên nguồn lực sẵn có trong các dạng trình bày, như là nhà xuất bản, một khoa của đại học, hoặc toàn bộ tập đoàn CONTRIBUTOR: (Các) cá nhân hoặc (các) tổ chức bổ sung thêm những ai có đóng góp đặc biệt vào thành phần các NGƯỜI CHẾ TÁC – CREATOR, những ai có những đóng góp trí tuệ đáng kể cho nguồn lực cũng như những ai có cống hiến hạng hai, hỗ trợ cho các cá nhân hoặc toàn bộ đặc biệt trong quá trình sáng tạo
DATE: Ngày tài nguyên được đưa lên thành dạng trình bày hiện nay TYPE: các mục của nguồn lực, như trang chủ, tiểu thuyết, thơ, giấy tờ công tác, báo cáo kỹ thuật, tiểu luận, luận văn, tự điển. Điều này phải làm để có tính chất hoặc thể loại của nguồn tài nguyên. LOẠI - TYPE sẽ được chọn từ danh sách đánh số của các loại
FORMAT. Dữ liệu đại diện cho tài nguyên, như text/html, ASCII, tập tin Postscript, các ứng dụng thực thi, hoặc ảnh JPEG. RESOURCE IDENTIFIER. Chuỗi hoặc số sử dụng để định ra tính duy nhất của tài nguyên. Các ví dụ từ các nguồn tài nguyên mạng bao gồm URLs, ISBN SOURCE. Công việc, bản in hoặc điện tử, những thứ mà nguồn tài nguyên được phát hành trên đó, nếu có thể. LANGUAGE. Ngôn ngữ của các nội dung trí tuệ của tài nguyên. RELATION. Tính liên quan của các tài nguyên khác nhau.
COVERAGE: Các không gian toạ lạc và các tính chất độ dài thời gian của nguồn tài nguyên. • RIGHTS: Lưu ý về bản quyền, tuyên bố về quyền quản trị.
Bài tập 6 • Biên mục theo 15 trường Dublin Core các tài liệu sau: - Sách - Bài trích từ báo - Chương/ đoạn trong sách - File ảnh - Tài liệu trên web
Bài tập 7 * Từng cá nhân thực hiện BST theo phân công. Các bước: • Chọn tài liệu, files cần tạo BST • Chuẩn bị các thông tin biên mục (Dublin core) cho từng tài liệu • Tạo BST (Gather, Enrich, Build)
1. Search Indexes Multi search indexes
Bài tập 7 – Tạo BST ảnh • Tạo BST mới: Đặt tên, mô tả, … • Chon tài liệu (Gather) • Biên mục (Enrich) • Xây dựng BST (Build) • Điều chỉnh Search Indexes Search and Browse
Bài tập 8 * Cá nhân thực tập điều chỉnh Search Indexes cho BST (SIDA) của mình
2. Classifier • Dùng để xây dựng cấu trúc duyệt tài liệu trên web của bộ sưu tập. Clasifier được khai báo trong file collect.cfg của BST • Cú pháp: • Classifier<tên classifier><tham số>
Phân loại Classifier • AZ List classifier (Title Metadata): liệt kê danh sách theo từng vùng alphabet