Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (827.02 KB, 53 trang )
Tuy nhiên, việc xây dựng Data Warehouse cho doanh nghiệp là một cơng việc
khơng hề đơn giản. Để có thể xây dựng Data Warehouse thì trước tiên chúng ta cần
phải biết được những khái niệm căn bản nhất về vấn đề này. Ba chương đầu tiên
của bản tiểu luận này sẽ đi tìm hiểu về các vấn đề đó.
Chương 1. Lịch sử phát triển của Data Warehouse
Chương này mô tả những lợi ích mà Data Warehouse mang lại cho người dùng
cuối, nhờ vậy ta có thể hiểu được điều gì đã khiến các doanh nghiệp tìm đến với
cơng nghệ này.
Chương này cũng sẽ điểm qua toàn bộ lịch sử phát triển của ngành công nghệ
thông tin theo hướng xuất hiện Data Warehouse. Phần này sẽ nhìn ngược trở về
lịch sử phát triển, như vậy ta có thể thấy được logic phát triển của công nghệ
Data Warehouse.
Mặc dù trong chương này em không đề cập chi tiết và đưa ra những định nghĩa
chặt chẽ về bất cứ một khái niệm mới nào, tuy nhiên em sẽ đi sâu tìm hiểu và
làm quen với hầu hết các khái niệm mới.
Chương 2. Những khái niệm về Data Warehouse
Chương này sẽ trình bày định nghĩa và kiến trúc logic của Data Warehouse
nhằm làm cho người học viên có được một cái nhìn tổng quan về Data
Warehouse.
Trong phần đầu chương em sẽ tìm hiểu các khái niệm về Data Warehouse.
Trong chương này học viên mong muốn thấy được phần nào sự phức tạp của
Data Warehouse trong định nghĩa của nó. Việc hiểu rõ định nghĩa của Data
Warehouse sẽ giúp học viên có được một định hướng rõ ràng hơn khi tìm hiểu
về kiến trúc của hệ thống sử dụng Data Warehouse.
Phần tiếp theo sẽ là kiến trúc logic của Data Warehouse. Phần này mô tả các
thành phần trong một hệ thống sử dụng Data Warehouse và các tiến trình cần
có để tổ hợp dữ liệu vào Data Warehouse.
Chương 3. Kiến trúc dữ liệu của Data Warehouse
Chương này mô tả kiến trúc cụ thể của Data Warehouse và cho thấy sự khác
biệt của nó với kiến trúc dữ liệu thông thường (kiến trúc dữ liệu quan hệ).
5
Học viên sẽ tìm hiểu sự khác nhau giữa hệ thống thơng tin và hệ thống tác
nghiệp, từ đó có thể hiểu được Data Warehouse cung cấp thông tin cho người
dùng cuối như thế nào.
Phần tiếp theo sẽ mô tả kiến trúc dữ liệu của Data Warehouse, nó sẽ giúp học
viên được làm quen với 2 mơ hình dữ liệu phổ biến nhất là dạng sao và dạng
bông tuyết.
6
CHƯƠNG 1
LỊCH SỬ PHÁT TRIỂN CỦA DATA WAREHOUSE
Trên thế giới có rất nhiều tổ chức hay cơng ty có những kho dữ liệu khổng lồ. Trong quá
trình hoạt động, do yêu cầu của công việc nên những tổ chức hay công ty này phải lưu lại
dữ liệu của khách hàng, sản phẩm, hóa đơn, ... Theo nghiên cứu thì cứ khoảng sau 5 năm
khối lượng dữ liệu của doanh nghiệp lại tăng lên gấp đơi. Tuy nhiên việc làm thế nào để
có thể khai thác được những kho dữ liệu khổng lồ này lại là một vấn đề nan giải bởi dữ
liệu thường không nhất quán và không được thiết kế với mục đích hỗ trợ quyết định. Vì
vậy cái mà các tổ chức và công ty này cần là một công cụ cho phép họ tổng hợp dữ liệu
một cách hiệu quả.
Sự ra đời của Data Warehouse bắt nguồn từ sự kết hợp của hai nhân tố kinh tế và kĩ thuật.
Các công ty, đặc biệt là các công ty lớn có nhiều chi nhánh khác nhau, rất muốn có được
những thơng tin tổng quan trên phạm vi tồn cơng ty, từ đó có thể giúp cho lãnh đạo của
cơng ty ra quyết định. Tuy nhiên, các hệ thống dữ liệu tác nghiệp trước đây khơng thể
hồn thành được cơng việc này vì chúng được thiết kế với mục đích là phục vụ cơng việc
nghiệp vụ hàng ngày, vì vậy cần phải có một cơng nghệ dữ liệu khác. Chính sự phát triển
của công nghệ được sự thúc đẩy mạnh mẽ của nhu cầu của các doanh nghiệp trong môi
trường kinh doanh đầy cạnh tranh đã tạo nên Data Warehouse.
Data Warehouse ra đời đã mang lại một số lợi ích nhất định cho các nhà kinh doanh :
•
Cho phép các nhà kinh doanh theo dõi được sự biến động của môi trường kinh
doanh : ở một khía cạnh nào đó, Data Warehouse có thể xem như là những
"ảnh chụp" liên tiếp tình trạng kinh doanh của cơng ty, vì vậy nó cho phép
người dùng cuối thấy được môi trường kinh doanh của cơng ty qua các thời
kì.
•
Là câu trả lời cho các câu hỏi truy vấn dữ liệu có tính thương mại. Các nhà
kinh doanh muốn rằng những câu hỏi họ đặt ra trong lĩnh vực kinh doanh sẽ
được trả lời theo dạng mà họ có thể hiểu được.
•
Cung cấp cơng cụ truy xuất dữ liệu nhằm mục đích phân tích và hỗ trợ quyết
định. Trong những hệ thống cơ sở dữ liệu tác nghiệp trước đây thì điều này rất
khó thực hiện ngay cả khi dữ liệu là đầy đủ và sẵn sàng, lý do đơn giản là vì hệ
thống cơ sở dữ liệu tác nghiệp được thiết kế ra với mục đích phục vụ cơng việc
7
tác nghiệp thường ngày chứ khơng phải được thiết kế ra với mục đích hỗ trợ
quyết định.
•
Thống nhất được dạng và cấu trúc dữ liệu phù hợp với yêu cầu của người dùng
cuối. Đối với các cơng ty có nhiều chi nhánh khác nhau thì có thể dữ liệu được
lưu trữ dưới các dạng khác nhau, ví dụ như cùng là đơn vị đo chiều dài nhưng có
nơi dùng đơn vị là cm, có nơi dùng đơn vị là inch, ... do vậy gây khó khăn cho
việc phân tích dữ liệu để hỗ trợ quyết định.
•
Quản trị dễ dàng. Sau khi được xây dựng, người quản trị có thể lên kế hoạch để
hệ thống vận hành tự động. Người quản trị chỉ có nhiệm vụ theo dõi, chỉnh sửa
và nâng cấp khi có yêu cầu hoặc sự cố.
Lợi ích của Data Warehouse đối với người dùng cuối và doanh nghiệp là khá rõ ràng.
Data warehouse đã được chứng minh là công nghệ mang lại hiệu quả đầu tư cao. Một
nghiên cứu của công ty Dữ liệu Quốc tế (IDC : International Data Corporation) trên 62
Data Warehouse cho biết tỉ lệ hiệu quả đầu tư trung bình cho Data Warehouse là 321% và
kết quả thu được có thể thấy sau một vài năm.
Lý thuyết hồn chỉnh về Data Warehouse được ra đời vào năm 1992 với sự xuất bản cuốn
sách "Building the data warehouse" của W. H. Inmon và Inmon được coi là cha đẻ của
Data Warehouse. Tuy nhiên trước đó Data Warehouse hay một phần của nó đã xuất hiện
dưới dạng này hay dạng khác.
Giữa thập kỉ 90 của thế kỉ 20, Data Warehouse đã trở thành một trong những từ thông
dụng nhất được sử dụng trong cơng nghiệp máy tính. Tuy nhiên cần phải nhấn mạnh rằng
Data Warehouse không thể phát triển theo hướng của các nhà sản xuất, trái lại nó phải
được phát triển bởi các công ty nhằm thỏa mãn nhu cầu kinh doanh của các cơng ty đó.
Vì vậy, Data Warehouse khơng phải là một sản phẩm hàng loạt, nó không phải được sản
xuất ra một lần rồi đem bán hay áp dụng cho nhiều đơn vị khác nhau. Data Warehouse là
một sản phẩm đơn chiếc, nó được sáng tạo một lần và được phát triển liên tục theo thời
gian nhằm đáp ứng đầy đủ những nhu cầu của người sử dụng. Nó chỉ thích hợp cho một
đơn vị và phải bám sát đặc điểm kinh doanh hay sản xuất của đơn vị đó.
Phần tiếp theo sẽ mơ tả từng bước phát triển của ngành công nghệ thông tin theo chiều
hướng tiến đến sự ra đời của Data Warehouse.
8