1. Trang chủ >
  2. Công nghệ thông tin >
  3. Hệ thống thông tin >

Phương pháp xây dựng ontology

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (507.21 KB, 47 trang )


Bài thu hoạch Công nghệ tri thức & Ứng dụng



HVTH: Lê Bảo Trung – CH1301112



Bước 1: Xác định lĩnh vực và phạm vi của Ontology

Trong giai đoạn này cần xác định mục đích của việc xây dựng ontology là gì? Phục

vụ đối tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh vực,

phạm vi nào. Quá trình khai thác, quản lý và bảo trì ontology được thực hiện ra sao?

Bước 2: Xem xét việc sử dụng lại các ontology có sẵn

Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng (Abstract), tầng miền

xác định (Domain) và tầng mở rộng (Extension). Trong đó tầng trừu tượng có tính tái sử

dụng rất cao, tầng miền xác định có thể tái sử dụng trong một lĩnh vực nhất định. Cộng

đồng Ontology cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, với tâm

huyết của nhiều chuyên gia. Do đó trước khi bắt đầu xây dựng ontology, cần xét đến khả

năng sử dụng lại các ontology đã có. Nếu có thể sử dụng lại một phần các ontology đã có,

chi phí bỏ ra cho quá trình xây dựng ontology sẽ giảm đi rất nhiều.

Bước 3: Liệt kê các thuật ngữ quan trọng

Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy

khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các

lớp trong ontology tương ứng. Tất nhiên không phải thuật ngữ nào cũng đưa vào

ontology, vì chưa chắc đã định vị được cho thuật ngữ đó. Do đó cần phải liệt kê các thuật

ngữ, để xác định ngữ nghĩa cho các thuật ngữ đó, cũng như cân nhắc về phạm vi của

ontology. Việc liệt kê các thuật ngữ còn cho thấy được phần nào tổng quan về các khái

niệm trong lĩnh vực đó, giúp cho các bước tiếp theo được thuận lợi.

Bước 4: Xác định các lớp và phân cấp của các lớp

Công việc xác định các lớp không chỉ đơn giản là tiến hành tìm hiểu về ngữ nghĩa

của các thuật ngữ đã có để có được các mô tả cho thuật ngữ đó, mà còn phải định vị cho

các lớp mới, loại bỏ ra khỏi ontology nếu nằm ngoài phạm vi của ontology hay hợp nhất

với các lớp đã có nếu có nhiều thuật ngữ có ngữ nghĩa như nhau (đồng nghĩa, hay đa

ngôn ngữ). Ngoài ra không phải thuật ngữ nào cũng mang tính chất như một lớp.



10



Bài thu hoạch Công nghệ tri thức & Ứng dụng



HVTH: Lê Bảo Trung – CH1301112



Một công việc cần phải tiến hành song song với việc xác định các lớp là xác định

phân cấp của các lớp đó. Việc này giúp định vị các lớp dễ dàng hơn.

Có một số phương pháp tiếp cận trong việc xác định phân cấp của các lớp:





Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa của các lớp



tổng quát nhất trong lĩnh vực và sau đó chuyên biệt hóa các khái niệm đó. Ví dụ: Trong

Ontology về quản lý nhân sự, ta bắt đầu với lớp Người, sau đó chuyên biệt hóa lớp Người

đó bằng cách tạo ra các lớp con của lớp Người như : Kỹ sư, Công nhân, Bác sỹ,… Lớp

Kỹ sư cũng có thể chuyên biệt hóa bằng cách tạo ra các lớp con như Kỹ sư CNTT, Kỹ sư

điện, Kỹ sư cơ khí, …





Phương pháp từ dưới lên (bottom-up): bắt đầu với định nghĩa của các lớp



cụ thể nhất, như các lá trong cây phân cấp. Sau đó gộp các lớp đó lại thành các khái tổng

quát hơn. Ví dụ: ta bắt đầu với việc định nghĩa các lớp như: nhân viên lễ tân, nhân viên

vệ sinh, nhân viên kỹ thuật. Sau đó tạo ra một lớp chung hơn cho các lớp đó là lớp nhân

viên.





Phương pháp kết hợp: kết hợp giữa phương pháp từ trên xuống và từ dưới



lên: bắt đầu từ định nghĩa các lớp dễ thấy trước và sau đó tổng quát hóa và chuyên biệt

hóa các lớp đó một cách thích hợp. Ví dụ ta bắt đầu với lớp nhân viên trước, là thuật ngữ

hay gặp nhất trong quản lý nhân sự. Sau đó chúng ta có thể chuyên biệt hóa thành các lớp

con: nhân viên lễ tân, nhân viên vệ sinh,… hoặc tổng quát hóa lên thành lớp Người.

Bước 5: Xác định các thuộc tính

Để xác định thuộc tính cho các lớp, ta quay trở lại danh sách các thuật ngữ đã liệt

kê được. Hầu hết các thuật ngữ còn lại (sau khi đã xác định lớp) là thuộc tính của các lớp

đó. Với mỗi thuộc tính tìm được, ta phải xác định xem nó mô tả cho lớp nào. Các thuộc

tính đó sẽ trở thành thuộc tính của các lớp xác định. Ví dụ lớp Người có các thuộc tính

sau: Họ, Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại,…



11



Bài thu hoạch Công nghệ tri thức & Ứng dụng



HVTH: Lê Bảo Trung – CH1301112



Bước 6: Xác định ràng buộc của các thuộc tính

Các thuộc tính có thể có nhiều khía cạnh khác nhau: như kiểu giá trị, các giá trị cho

phép, số các thuộc tính (lực lượng), và các đặc trưng khác mà giá trị của thuộc tính có thể

nhận. Ví dụ: “Năm sinh” của một “nhân viên” chỉ có duy nhất và là số nguyên, có thể

nhận giá trị từ 1948 đến 1990. Cần phải xác định các ràng buộc cho một thuộc tính càng

chặt chẽ càng tốt, để tránh trường hợp nhập dữ liệu sai, dẫn đến đổ vỡ của các ứng dụng

sử dụng Ontology này.

Bước 7: Tạo các thể hiện / thực thể

Bước cuối cùng là tạo ra các thể hiện của các lớp trong sự phân cấp. Việc tạo thể

hiện cho một lớp là quá trình điền các thông tin vào các thuộc tính của lớp đó.



12



Bài thu hoạch Công nghệ tri thức & Ứng dụng



HVTH: Lê Bảo Trung – CH1301112



III. CƠ SỞ TRI THỨC TÍNH TOÁN ĐỐI TƯỢNG ONTOLOGY

Có rất nhiều phương pháp đại diện cho tri thức [2], [4], [9].Những phương pháp này

đang được quan tâm và hữu dụng cho nhiều ứng dụng, tuy nhiên chúng không đủ mạnh

và rất khó sử dụng cho việc xây dựng hệ cơ sở tri thức trong các lĩnh vực tri thức khác

nhau.

Cơ sở tri thức tính toán đối tượng Ontology (COKB-ONT) và các mô hình của nó đã

được thiết lập từ cách hướng đối tượng để biểu diễn tri thức cùng với các kỹ thuật lập để

tính toán hình thức. Đã có nhiều kết quả và các công cụ cho các phương pháp hướng đối

tượng, và một số nguyên tắc cũng như kỹ thuật, cách này còn cho chúng ta một phương

pháp mô hình hóa việc giải toán và thiết kế thuật toán .Các mô hình này rất hữu ích cho

việc xây dựng các thành phần và tri thức cơ sở cho toàn bộ hệ tri thức cơ bản trong lĩnh

vực giáo dục.



1 Các thành phần của mô hình COKB

Mô hình tri thức của các cơ sở tính toán đối tượng (mô hình COKB) bao gồm 6

thành phần:



(C, H, R, Ops, Funcs, Rules)

Ý nghĩa của các thành phần như sau:

-



C: Tập các khái niệm của các đối tượng tính toán (C- Object).

H: Tập các quan hệ phân cấp có liên quan của các khái niệm

R: Tập các mối quan hệ về các khái niệm.

Ops: Tập các toán tử.

Funcs: Tập các hàm.

Rules: Tập các luật

Mỗi khái niệm trong C là một lớp của C-Objects. Cấu trúc C-objects có thể được



mô hình hóa bằng (Attrs, F, Facts, Rules).



13



Bài thu hoạch Công nghệ tri thức & Ứng dụng

-



HVTH: Lê Bảo Trung – CH1301112



Attrs là một tập các thuộc tính

F là một tập hợp các phương trình được gọi là quan hệ tính toán

Facts là tập hợp các thuộc tính hoặc sự kiện của đối tượng.

Rules là tập các quy tắc suy luận dựa trên Facts.



Một đối tượng cũng có những trạng thái cơ bản để giải những bài toán trên các

thuộc tính của nó. Những đối tượng được trang bị những khả năng giải toán như:

1. Xác định bao đóng của một tập các thuộc tính

2. Suy luận và đưa lời giải cho các bài toán dạng: Xác định một số thuộc tính từ các



thuộc tính khác.

3. Thực hiện tính toán

4. Đề xuất hoàn thiện giả thiết nếu cần.



Đây là những quan hệ đại diện chuyên biệt giữa những khái niệm trong tập C; H

đại diện những quan hệ đặc biệt trên C. Quan hệ này được đặt trước trên tập C, và H có

thể được xem như biểu đồ Hasse cho mối quan hệ đó. R là tập các quan hệ còn lại trên

tập C, và trong trường hợp quan hệ r là một quan hệ nhị phân thì nó có thể có những tính

chất như phản xạ, đối xứng… Trong hình học phẳng và hình học giải tích, có rất nhiều

quan hệ như: “thuộc về” một điểm và đường thẳng, quan hệ “song song” giữa hai đoạn

thẳng, quan hệ “vuông góc” giữa hai đoạn thẳng, quan hệ bằng nhau giữa các tam giác…

Tập Ops bao gồm các toán tử trên C. Thành phần này đại diện cho một phần tri

thức về các toán tử trên các đối tượng. Hầu hết các lĩnh vực tri thức có một thành phần

bao gồm các toán tử.

Tập Funcs bao gồm các hàm trên C-objects. Tri thức về các hàm này cũng phổ

biến như tri thức trên hầu hết các lĩnh vực tri thức trong thực tế, đặc biệt là lĩnh vực khoa

học tự nhiên như Toán, vật lý…

Tập Rules thể hiện các quy tắc suy luận, những quy tắc này tượng trưng cho các

báo cáo, định lý, nguyên tắc, công thức…Hầu hết các quy tắc đầu có thể được viết dưới

dạng “ifthen” Trong cơ cấu của một quy tắc suy luận, là một tập

14



Bài thu hoạch Công nghệ tri thức & Ứng dụng



HVTH: Lê Bảo Trung – CH1301112



hợp các sự kiện với phân loại nhất định.Vì vậy, chúng tôi sử dụng các quy tắc suy diễn

trong mô hình COKB. Sự kiện phải được phân loại để các quy tắc thành phần có thể được

xác định và xử lý trong các công cụ suy luận của hệ thống cơ sở tri thức hoặc các hệ

thống thông minh.

Cơ sở tri thức trên mô hình COKB có thể được tổ chức bởi các thành phần sau:

1. Từ điển các khái niệm về loại của các đối tượng, các thuộc tính, các toán tử, các



hàm, quan hệ và các khái niệm liên quan.

2. Bảng mô tả cho các cấu trúc và các đặc trưng của các đối tượng. Ví dụ, chúng ta

có thể yêu cầu một hình tam giác để tính toán và cung cấp cho chúng ta các thuộc

3.

4.

5.

6.

7.



tính của nó.

Các bảng tượng trưng cho mối liên hệ phân cấp của các khái niệm.

Các bảng tượng trưng cho các mối quan hệ khác của các khái niệm.

Các bảng mô tả tri thức về các toán tử

Các bảng đại diện cho tri thức về các hàm

Các bảng mô tả cho các loại sự kiện. Ví dụ, một quan hệ thực tế bao gồm các loại

của mối quan hệ và danh sách của các đối tượng liên quan.



8. Các bảng mô tả cho các quy tắc. Ví dụ, một quy tắc suy luận bao gồm một phần



giả thuyết và phần kết luận. Cả hai đều là danh sách các sự kiện.

9. Danh sách hay tập hợp các quy tắc.

10. Danh sách các bài toán mẫu



4. Các loại sự kiện trong mô hình COKB

Trong mô hình COKB có 11 loại sự kiện được chấp nhận.

Các loại các sự kiện đã được đề xuất từ nghiên cứu về các yêu cầu thực tế và các

bài toán khác nhau trong lĩnh vực tri thức. Các loại sự kiện như sau:

-



Sự kiện loại 1: thông tin về loại đối tượng.

Sự kiện loại 2: xác định một đối tượng hoặc một thuộc tính của một đối tượng.

Sự kiện loại 3: xác định một đối tượng hoặc một thuộc tính của một đối tượng

bằng một giá trị hoặc một hằng số biểu thức.



15



Bài thu hoạch Công nghệ tri thức & Ứng dụng

-



HVTH: Lê Bảo Trung – CH1301112



Sự kiện loại 4: bình đẳng trên các đối tượng hoặc các thuộc tính của các đối tượng.

Loại sự kiện này cũng rất phổ biến, và có nhiều bài toán liên quan đến cơ sở tri



-



thức

Sự kiện loại 5: sự phụ thuộc của một đối tượng với các đối tượng khác bằng một



-



phương trình chung.

Sự kiện loại 6: mối liên hệ trên các đối tượng hoặc các thuộc tính của các đối

tượng. Trong hầu hết các bái toán có những sự kiện thuộc loại 6 như hai đường

thẳng song song, một đường thẳng vuông góc với một mặt phẳng, một điểm thuộc



-



về một đoạn thẳng.

Sự kiện loại 7: xác định của một hàm.

Sự kiện loại 8: xác định của một hàm bởi một giá trị hoặc biểu thức là một hằng



-



số.

Sự kiện loại 9: đẳng thức giữa một đối tượng và một hàm

Sự kiện loại 10: đẳng thức giữa hai hàm

Sự kiện loại 11: sự phụ thuộc của một hàm với các hàm khác hoặc các đối tượng

khác của một phương trình.Các mô hình trên và các loại sự kiện có thể được sử

dụng để biểu diễn cho tri thức trong các ứng dụng thực tế. Thuật toán thống nhất

các sự kiện đã được hình thành và sử dụng trên nhiều ứng dụng khác nhau



5. Phương pháp thiết kế

Trong phần tiếp theo sẽ trình bày quá trình để xây dựng một hệ thống cơ sở tri thức

giải quyết một số bài toán cao cấp. Bên cạnh đó, kỹ thuật trong từng giai đoạn sẽ được

trình bày.

a) Cấu trúc của hệ thống

Một hệ thống hỗ trợ tìm kiếm, truy vấn và giải quyết các vấn đề toán học cao cấp, có

cấu trúc của một hệ chuyên gia. Chúng tôi có thể thiết kế hệ thống bao gồm sáu thành

phần:

-



Các cơ sở tri thức.

Các công cụ suy luận.

Giải thích cho các thành phần

Bộ nhớ làm việc.

16



Xem Thêm
Tải bản đầy đủ (.docx) (47 trang)

×