1. Trang chủ >
  2. Thạc sĩ - Cao học >
  3. Công nghệ thông tin >

ỨNG DỤNG XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ CÁC HỆ THỐNG HỌC TẬP TRỰC TUYẾN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (827.02 KB, 53 trang )


Khảo sát kết quả học

tậpII.xxKiến trúc của ứng dụngỨng dụng thử nghiệm xây dựng dựa trên kiến trúc NDS+DDS, với mơ hình như

sau:Với u cầu cho phép mở rộng để đưa dữ liệu từ các nguồn khác nhau vào kho dữ

liệu, hệ thống tích hợp dữ liệu được thiết kế để việc mở rộng là thuận tiện nhất. Ở đây

CSDL chuẩn hóa, kho dữ liệu và q trình tích hợp dữ liệu từ CSDL chuẩn hóa vào

kho dữ liệu là chung cho tất cả các loại nguồn dữ liệu. Với một loại nguồn dữ liệu sẽ

có cấu trúc vùng xử lý khác nhau, q trình tích hợp dữ liệu từ dữ liệu nguồn vào vùng

xử lý và từ vùng xử lý vào CSDL chuẩn hóa khác nhau.1. Thiết kế kho dữ liệu

1.1.

Vùng xử lí

1.1.1.

Moodle

Hệ thống Moodle có khoảng 200 bảng dữ liệu. Tuy nhiên để lấy dữ liệu cho

data warehouse được thiết kế ở trên ta chỉ sử dụng các bảng và các trường sau:33Hình: Vùng xử lí cho dữ liệu nạp từ Moodle

Ở đây có một số chú ý đối với dữ liệu trong vùng xử lí của Moodle:

• Trường full_path_name của bảng stg_course_categories là khoá tự

nhiên sinh ra trong q trình rút trích dữ liệu. Lí do là dữ liệu nguồn

khơng có khố tự nhiên khác với định danh hệ thống. Việc tạo ra khoá

tự nhiên nhằm tránh xung đột về dữ liệu.

• Vùng xử lí chỉ bao gồm khố tự nhiên và các thuộc tính cần thiết, khơng

bao gồm khố chính, khố ngoại hay chỉ mục, nhằm tăng tốc q trình

sao chép dữ liệu từ nguồn.

• Những bảng có trường last_update là những bảng khơng chứa thơng tin

lịch sử thay đổi của nguồn. last_update là trường do hệ thống ETL tạo ra

trong q trình rút trích nhằm ghi nhận các thay đổi này. Các bảng khác

sử dụng trường timemodified trong dữ liệu nguồn để ghi nhận thay đổi

từ nguồn.1.1.2.Kết quả học tậpDữ liệu về kết quả học tập, học kỳ, năm học khơng có trong moodle. Cho nên

nếu muốn phân tích các vấn đề liên quan tới các dữ liệu này, người dùng cần phải

nhập dữ liệu bằng file excel có cấu trúc như sau (do ứng dụng bao đóng quy

định):

Dữ liệu kết quả học tập: file excel với cột 1 chứa mã khóa học (có header là

CourseID), cột 2 là mã sinh viên (có header là StudentID), cột 3 là điểm (có

header là Value)34Hình: Cấu trúc tập tin chứa kết quả học tập1.1.3.Dữ liệu học kỳ, năm họcFile excel với cột 1 chứa số thứ tự học kỳ trong năm học (có header là

TermNumber), cột 2 chứa tên học kỳ (có header là TermName), cột 3 chứa năm

bắt đầu năm học (có header là AcademicYear), cột 4 chứa tên năm học (có header

là AcademicYearName), cột 5 và cột 6 chứa ngày bắt đầu và ngày kết thúc học

kỳ (có header lần lượt là BeginDate và EndDate). Ngày tháng có định dạng

năm/tháng/ngày (YYYY/mm/DD)Hình: Cấu trúc tập tin chứa thơng tin các học kì, năm học1.2.

Cơ sở dữ liệu chuẩn hoá

1.2.1.

Lược đồ

Cơ sở dữ liệu chuẩn hoá được tổ chức dưới dạng chuẩn 3, như hình dưới đây:351.2.2.Các diễn giải liên quan đến thiết kếCác thuộc tính category_full_path và parent_category_full_path là các

khố tự tạo trong q trình trích xuất dữ liệu từ nguồn đưa vào vùng xử

lí như đã trình bày bên trên. (Xem mục 5.3.1.1. Moodle)

• Các thuộc tính last_update của các bảng là thời gian cập nhật dòng dữ

liệu lần cuối cùng từ nguồn. Đối với các bảng mà dữ liệu nguồn có lưu

lịch sử thay đổi, last_update là giá trị thời gian của cột tương ứng trong

36bảng đó. Đối với các bảng mà dữ liệu nguồn không lưu lịch sử thay đổi,

sử dụng thời điểm rút trích dữ liệu cho thuộc tính last_update.1.2.3.Đặc tả cơ sở dữ liệu Nds_modules: lưu trữ thông tin về các mô đun trong hệ thốngTên thuộc tính

module_nameKiểu giá trị

varcharÝ nghĩa

Tên mơ đun website hệ thống nguồn

(khóa chính)module_descriptiontextMơ tả mơ đunlast_updatedatetimeThời điểm cập nhật cuối cùng Nds_categories: lưu trữ thông tin về nhóm các khóa họcTên thuộc tính

category_full_pathKiểu giá trị

varcharÝ nghĩa

Khố tự nhiên của nhóm khố

học, tạo ra bằng cách ghép nối tên

các nhóm khố học từ nó lên đến

nút gốc trên cây phân cấp, ngăn

cách bằng dấu ‘;’parent_category_full_patvarcharKhoá tự nhiên của nhóm mơn học

cha.category_namevarcharTên nhóm khóa họccategory_descriptiontextMơ tả nhóm khóa họcdepthtinyintĐộ sâu của nhóm khố học trênhcây phân cấp.

last_updatedatetimeThời điểm cập nhật cuối cùng Nds_courses: lưu trữ thông tin về khóa họcTên thuộc tính

course_codeKiểu giá trị

varcharÝ nghĩa

Mã khóa họccategory_full_namevarcharNhóm khố học. Khố ngoại

thamchiếuđếnbảngnds_categories

term_numbertinyintThứ tự học kỳ

37year_numberintNăm họccourse_namevarcharTên khóa họccourse_descriptiontextMơ tả khóa họccourse_start_datedatetimeNgày bắt đầu khóa họccourse_created_datedatetimeNgày khởi tạo khóa học trong hệ

thốnglast_updatedatetimeThời điểm cập nhật cuối cùng Nds_terms: lưu trữ thông tin về học kỳTên thuộc tính

term_numberKiểu giá trị

intÝ nghĩa

Thứ tự học kỳ trong năm họcyear_numbertinyintNăm học, tham chiếu đến bảng

nds_academic_yearsterm_namevarcharTên học kỳbegin_datedateNgày bắt đầu học kỳend_datedateNgày kết thúc học kỳlast_updatedatetimeThời điểm cập nhật cuối cùng Nds_academic_years:Tên thuộc tính

year_numberKiểu giá trị

intÝ nghĩa

Năm họcacademic_year_namevarcharTên năm họclast_updatedatetimeThời điểm cập nhật cuối cùng Nds_role: lưu trữ thơng tin vai trò người dùng trong hệ thốngTên thuộc tính

role_nameKiểu giá trị

varcharÝ nghĩa

Tên vai tròrole_descriptiontextMơ tả vai tròlast_updatedatetimeThời điểm cập nhật cuối cùng Nds_users: lưu trữ thông tin người dùng

38Tên thuộc tính

user_name

description

first_name

last_name

email

phone_1

phone_2

institution

department

address

city

last_updateKiểu giá trị

varchar

text

varchar

varchar

varchar

varchar

varchar

varchar

varchar

varchar

varchar

timestampÝ nghĩa

Tên đăng nhập của người dùng

Mô tả người dùng

Họ người dùng

Tên thật người dùng

Email người dùng

Số điện thoại người dùng

Số điện thoại người dùng

Tên cơ quan

Tên phòng ban

Địa chỉ người dùng

Thành phố người dùng đang ở

Thời điểm sửa đổi cuối cùng Nds_actions:lưu trữ thông tin các thao tác trong hệ thốngTên thuộc tính

action_nameKiểu giá trị

varcharÝ nghĩa

Tên thao tácaction_descriptiontextMô tả thao táclast_updatedatetimeThời điếm cập nhật cuối cùng Nds_logs: lưu trữ thông tin log của hệ thốngTên thuộc tính

course_codeKiểu giá trị

varcharÝ nghĩa

Mã khóa học, tham chiếu đến

bảng nds_coursesuser_namevarcharMã người dùng, tham chiếu đến

bảng nds_usersmodule_namevarcharTên mô đun, tham chiếu đến bảng

nds_modulesaction_namevarcharTên hoạt động, tham chiếu đến

bảng nds_actionsaccess_timedatetimeThời điểm truy cập vào hệ thốnglast_updatedatetimeThời điểm cập nhật cuối cùng Nds_results: lưu trữ thông tin kết quả học tậpTên thuộc tính

course_codeKiểu giá trị

varcharÝ nghĩa

Mã khóa học, tham chiếu đến

39bảng nds_courses

user_namevarcharTên người dùng, tham chiếu đến

bảng nds_usersgradefloatĐiếm số của người dùng với khóa

học tương ứnglast_updatedatetimeThời điểm cập nhật cuối cùng Nds_role_assignments: lưu thơng tin về vai trò của người dùng ở một khóa họctrong hệ thống.

Tên thuộc tính

user_nameKiểu giá trị

varcharÝ nghĩa

Tên người dùng, tham chiếu đến

bảng nds_userscourse_codevarcharMã khóa học, tham chiếu đến

bảng nds_coursesrole_namevarcharTên vai trò, tham chiếu đến bảng

nds_roleslast_update1.3.datetimeThời điểm cập nhật cuối cùngKho dữ liệu đầu cuối1.3.1. Lược đồ cơ sở dữ liệu401.3.2. Các diễn giải liên quan đến thiết kế

Bảng category_bridge được tạo ra nhằm khử truy vấn đệ quy trên nhóm

khố học. Đây là cây phân cấp khơng giới hạn độ sâu.

Chẳng hạn:

Có cây phân cấp đệ quy khơng giới hạn độ sâu như sau:

41Hình: Cây phân cấp không giới hạn độ sâu.

Bảng cầu nối được tạo ra có nội dung như sau:Hình: Bảng cầu nối được tạo ra

Ở đây, mỗi dòng trong bảng cầu nối mơ tả một quan hệ cha con. Mỗi dòng cho

biết các thơng tin sau:

o manager_key: khố đại diện của cha

o employee_key: khoá đại diện của con

o nest_level: độ sâu từ cha đến con.

o is_top/is_bottom: cho biết con có phải là nút gốc/nút lá của cây

hay khơng.

• Bảng dim_role_group và role_group_bridge được tạo ra để giải quyết

tình trạng dữ kiện đa trị (multivalued fact). Ở đây, mỗi một người dùng

ghé thăm một trang mơn học nào đó, người dùng đó có thể đóng một

hoặc nhiều vai trò (role) trong. Chẳng hạn một người có thể vừa là sinh

viên, vừa là trưởng nhóm.

• Thuộc tính role_count cho biết số lượng vai trò trong nhóm đó. Thuộc

tính weighting_factor là trọng số, xác định mức độ tham gia của một vai

trò trong một nhóm vai trò nào đó. Thuộc tính này nhằm tránh tình trạng

thống kê kép. Được tính theo cơng thức sau:

weighting_factor = 1 / role_count1.3.3. Đặc tả cơ sở dữ liệu

42Các bảng chiều:

 dim_date: chiều ngày tháng, sử dụng đơn vị học kỳ, năm họcTên thuộc tính

date_key

date_alternate_key

day_number_of_week

day_name_of_week

day_number_of_month

day_number_of_term

week_number_of_term

month_number_of_year

month_name_of_year

year_number

term_name

term_number

academic_year_name

academic_year

is_weekend

is_holiday

last_update

 dim_time: chiều thời gianTên thuộc tính

time_key

time_alternate_key

hour

minute

second

Kiểu giá trị

int

time

tinyint

tinyint

tinyintÝ nghĩa

Khố chính (Khố đại diện)

Thời gian đầy đủ

Giờ

Phút

Giâydim_user: Chiều người dùngTên thuộc tính

user_keyKiểu giá trị

intuser_business_key

user_name

user_description

first_name

last_name

email

phone_1

phone_2

institutionvarchar

varchar

text

varchar

varchar

varchar

varchar

varchar

varcharÝ nghĩa

Khoá chính (Khố đại diện)

Khóa tự nhiên của người dùng

trong CSDL chuẩn hóa

Tên đăng nhập của người dùng

Mơ tả người dùng

Họ người dùng

Tên thật người dùng

Email người dùng

Số điện thoại người dùng

Số điện thoại người dùng

Tên cơ quan

43Xem Thêm
Tải bản đầy đủ (.docx) (53 trang)

×