Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.88 MB, 63 trang )
được xác định [9]. Xét nghiệm huyết thanh học đã được phát hiện bởi Widal, bằng
việc tìm ra phản ứng ngưng kết đối với huyết thanh người mắc bệnh thương hàn năm
1896 và thử nghiệm Wassermann cho bệnh giang mai năm 1906 [9]. Với việc khám
phá ra các nguyên tắc miễn dịch của cơ thể con người đã dẫn đến sự phát triển của việc
tiêm chủng chủ động để phòng ngừa các bệnh cụ thể [9]. Bên cạnh đó, những tiến bộ
trong điều trị đã mở ra những cách khác để dự phòng bệnh bạch hầu bằng thuốc kháng
sinh và bệnh giang mai bằng arsphenamine [9]. Năm 1932, các thuốc sulfonamide và
sau đó là kháng sinh bao gồm penicillin, streptomycin, chlortetracycline và
chloramphenicol tạo ra cơ hội mới để phòng ngừa và chữa trị các bệnh do các vi khuẩn
khác nhau gây ra [9].
Sau năm 1900, có thêm nhiều tiến bộ khác trong lĩnh vực y học dự phòng, việc sử
dụng tia X và các chất phóng xạ trong chẩn đốn và điều trị bệnh (ví dụ như bệnh lao
và ung thư) cũng như trong nghiên cứu sinh lý cơ bản đã mở ra những khả năng mới
[9]. Sự hiểu biết sâu hơn về các chức năng nội tiết, với việc sản xuất các chiết xuất
hoocmơn có sẵn như insulin, dẫn đến các biện pháp phòng ngừa các bệnh chuyển hóa
nhất định [9]. Vai trò của dinh dưỡng trong sức khoẻ và bệnh tật và của nhiều yếu tố
thực phẩm thiết yếu đối với sức khoẻ của chế độ ăn uống hợp lý [9]. Những tiến bộ
khác của Thế kỷ 20 trong lĩnh vực y tế dự phòng bao gồm sự thừa nhận rộng hơn các
yếu tố tâm lý liên quan đến tổng thể sức khoẻ con người, các kỹ thuật phẫu thuật,
phương pháp gây tê mới và nghiên cứu di truyền học [9].
1.1.2. Những vai trò của lĩnh vực y tế dự phòng
Trong khi một số người nghĩ rằng bác sĩ như là một ai đó để khám, chữa cho họ khi
bị bệnh, có một sự thật là việc gặp bác sĩ về y tế dự phòng cũng quan trọng không kém
quan trọng trong việc quản lý sức khoẻ của bản thân, như chúng ta vẫn thường nghe
câu phòng bệnh hơn chữa bệnh [1]. Ngăn ngừa bệnh tật bằng cách kiểm tra tình trạng
sức khoẻ để phát hiện những nguy cơ tiềm ẩn, tiêm vắc xin đầy đủ và áp dụng các thói
quen lành mạnh là những cách để chúng ta có thể sống một cuộc sống khỏe mạnh hơn.
Từ những nhu cầu cấp thiết trong cơng tác phòng chống nguy cơ và bảo vệ sức
khỏe người dân, lĩnh vực y tế dự phòng có những vai trò cụ thể sau:
- Giám sát, phát hiện sớm các bệnh truyền nhiễm, các nguồn bệnh chưa rõ nguyên
nhân [1];
- Tổ chức thực hiện các biện pháp phòng, chống và kiểm sốt dịch bệnh [1];
- Quản lý dữ liệu và cung cấp thông tin rộng rãi cho xã hội về các bệnh và dịch
bệnh truyền nhiễm [1];
- Phòng, chống bệnh khơng lây nhiễm, bệnh xã hội [1];
- Giám sát và phòng, chống bệnh không lây nhiễm, bệnh xã hội [1];
- Thực hiện các hoạt động phòng, chống yếu tố nguy cơ bệnh khơng lây nhiễm;
2
triển khai các hoạt động phòng, chống tác hại của lạm dụng rượu bia và đồ uống có
cồn khác [1];
- Thực hiện và kiểm tra, giám sát hoạt động phòng, chống bệnh khơng lây nhiễm,
bệnh xã hội; thống kê, báo cáo, xây dựng và quản lý cơ sở dữ liệu về bệnh không lây
nhiễm, bệnh xã hội [1];
- Nghiên cứu, phát triển và sử dụng vắc xin, sinh phẩm y tế hỗ trợ phòng ngừa các
bệnh truyền nhiễm một cách chủ động [1];
- Hướng dẫn, kiểm tra việc sử dụng vắc xin, sinh phẩm y tế và an toàn tiêm chủng
[1].
1.2. Dịch bệnh
Bệnh là tình trạng bất thường, ảnh hưởng xấu đến cấu trúc hoặc chức năng của một
phần hoặc tồn bộ cơ thể con người, nhưng khơng do chấn thương nào từ bên ngoài
gây ra [5]. Một căn bệnh có thể do các yếu tố bên ngồi như tác nhân gây bệnh hoặc
rối loạn chức năng nội bộ gây ra [5]. Ví dụ, rối loạn chức năng nội bộ của hệ thống
miễn dịch có thể tạo ra nhiều bệnh khác nhau, bao gồm các dạng suy giảm miễn dịch,
mẫn cảm, dị ứng và rối loạn tự miễn dịch.
Trên cơ thể người, khái niệm bệnh được sử dụng để chỉ tình trạng gây đau đớn, rối
loạn chức năng, sang chấn tâm lý hoặc tử vong của người bị bệnh, hoặc các vấn đề
tương tự đối với những người tiếp xúc với người bệnh đó [5]. Theo nghĩa rộng hơn,
đơi khi nó bao gồm những thương tích, khuyết tật, rối loạn, hội chứng, nhiễm trùng,
triệu chứng bị cô lập, hành vi sai lệch (không làm chủ được hành vi) và các biến thể
khơng điển hình của cấu trúc và chức năng trên cơ thể. Có bốn loại bệnh chính: bệnh
truyền nhiễm, bệnh thiếu hụt vi chất, bệnh di truyền và bệnh sinh lý [5]. Bệnh cũng có
thể được phân loại theo những cách khác, chẳng hạn như các bệnh truyền nhiễm và
không lây nhiễm [5].
Dịch bệnh là bệnh được lan truyền nhanh chóng và ảnh hưởng đến số lượng lớn
người trong vòng một thời gian rất ngắn [5]. Khi có dịch bệnh xuất hiện các cơ quan
kiểm soát dịch bệnh thực hiện các biện pháp nghiệm vụ trong thẩm quyền quản lý để
khoang vùng, khống chế dịch. Ví dụ, với bệnh sởi khi số lượng mắc lớn hơn 15 trường
hợp trên 100.000 người trong thời gian hai tuần liên tiếp có thể đưa ra cảnh báo dịch
bệnh truyền nhiễm.
Trong những năm gần đây, chúng ta phải đối mặt với tình hình dịch bệnh hồnh
hành, bùng phát nhanh chóng và diễn biến phức tạp, đặc biệt là các dịch bệnh nguy
hiểm, Ebola, MERS-CoV liên tục gia tăng, dịch bệnh cúm A(H5N1), A(H7N9)... chưa
khống chế được triệt để; bệnh do vi rút Zika lây truyền mạnh mẽ. Nhiều bệnh truyền
nhiễm trước đây đã bị khống chế, nhưng gần đây bùng phát và gia tăng trở lại như: tay
chân miệng, sốt xuất huyết, bại liệt, sởi... Chỉ tính riêng năm 2017, trên thế giới tình
hình dịch bệnh diễn biến phức tạp, xuất hiện nhiều dịch bệnh mới; số ca mắc cúm
3
A(H7N9) liên tục xuất hiện tại Trung Quốc, MERS-CoV bùng phát tại Trung Đơng.
Có thể thấy, dịch bệnh ngày càng diễn biến phức tạp về phạm vi và chủng loại. Thực
tế đó, đòi hỏi cơng tác y tế dự phòng cần phải được đẩy mạnh, nâng cao nhằm khoanh
vùng và hạn chế sự lây lan của dịch bệnh. Công tác giám sát dịch bệnh lây nhiễm,
phân tích và dự báo phục vụ ra quyết định ngày càng trở nên quan trọng và cần được
đẩy mạnh.
1.3. Dự báo dịch bệnh trong lĩnh vực y tế dự phòng
Hoạt động dự báo hỗ trợ các cơ quan, tổ chức đưa ra những thông tin nhận định
cho tương lai trên cơ sở các thơng tin đã có trong quá khứ và hiện tại. Lĩnh vực y tế dự
phòng là một mảng lớn cho các hoạt động dự báo, với nhiều cấp độ khác nhau từ phạm
vi một địa phương, quốc gia và tồn cầu. Vì vậy, hoạt động dự báo tình hình diễn biến
dịch bệnh trong lĩnh vực y tế dự phòng ln nhận được sự quan tâm từ các nhà nghiên
cứu. Thông qua hoạt động dự báo, nhận định trước xu hướng diễn biến của dịch bệnh,
giúp các cơ quan chức năng chủ động triển khai các biện pháp ngăn chặn sự bùng phát
và lây lan của dịch bệnh. Hoạt động nghiên cứu dự báo tình hình dịch bệnh truyền
nhiễm thời gian qua đã góp phần quan trọng giúp các nhà quản lý và hoạch định chính
sách trong cơng tác lập kế hoạch và định hướng chính sách y tế.
Cùng với sự phát triển của khoa học, đã có nhiều phương pháp và kỹ thuật mới
được ứng dụng trong hoạt động dự báo. Dự báo dựa vào các kỹ thuật khai phá dữ liệu
đang được ứng dụng rộng rãi. Từ thực tế, các hoạt động nghiên cứu trên thực địa
thường gặp những hạn chế về nguồn lực và thời gian, thì việc ứng dụng khai phá dữ
liệu trong dự báo dịch bệnh, góp phần giải quyết bài tốn dự báo dịch bệnh với chi phí
thấp. Ở Việt Nam, ứng dụng các phương pháp và kỹ thuật khai phá dữ liệu trong dự
báo dịch bệnh vẫn chưa được triển khai nhiều với số ít các nhà nghiên cứu, trong khi
nhu cầu dự báo phục vụ xây dựng các chương trình, hoạt động, chính sách y tế ngày
càng tăng.
Do điều kiện tự nhiên như biến đổi khí hậu, môi trường, nhiều bệnh dịch truyền
nhiễm trước đây đã được đầy lùi, nay lại bùng phát mạnh mẽ với nhiều biến thể và
chủng loại mới, đặc biệt tại các vùng có điều kiện khí hậu khắc nghiệt. Bên cạnh việc
nghiên cứu để tìm ra nguyên nhân và yếu tố gây nên sự bùng phát của dịch bệnh, cần
phải ứng dụng các kỹ thuật dự báo khác nhau để xây dựng mơ hình dự báo dịch bệnh,
dựa trên tác động của các yếu tố điều kiện tự nhiên, khí hậu, mơi trường..., nhằm đưa
ra cảnh báo sớm diễn biến dịch bệnh trong tương lại, chủ động triển khai các công tác
nghiệp vụ, qua đó giúp giảm thiểu nguy cơ và thiệt hại của dịch bệnh đến con người.
Trong những năm gần đây, cùng với sự phát triển bùng nổ của Internet làm gia tăng
các nguồn dữ liệu, trong đó có dữ liệu dịch bệnh, khí hậu, thời tiết,… được thu thập
thường xuyên từ khắp nơi trên thế giới, đó là một điều kiện lý tưởng cho công tác dự
báo, bên cạnh đó sự phát triển của các phương pháp và kỹ thuật dự báo đem lại cơ hội
mới cho sự bùng nổ hoạt động phân tích và dự báo dịch bệnh trong lĩnh vực y tế.
4
1.4. Thực trạng nghiên cứu dự báo trong y tế dự phòng
Đến nay, có nhiều mơ hình dự báo dịch bệnh được xây dựng và ứng dụng trong
lĩnh vực y tế. Ví dụ, mơ hình tốn học của bệnh sốt rét được bắt đầu nghiên cứu năm
1911 với mơ hình của Ross và được cải tiến bởi Macdonald năm 1957. Gần đây, có rất
nhiều mơ hình nghiên cứu bệnh sốt rét như: mơ hình dịch tễ toán học SIR (Susceptible
– Infected – Recovered) và SIS (Susceptible – Infected - Susceptible) với tư tưởng
chính là xây dựng mơ hình dự báo sự lan truyền của bệnh thơng qua số người và số
muỗi bị nhiễm bệnh. Qua tham khảo, nhận thấy các phương pháp dự báo dịch bệnh
ban đầu đều dựa trên mơ hình lan truyền dịch bệnh, điển hình cho tư tưởng này là mơ
hình SIR. Ý tưởng của mơ hình này là phân tách tổng số người trong một khu vực bị
nhiễm bệnh thành 3 lớp, trong đó:
- Lớp dễ bị bệnh S: Những người trong lớp này chưa hề mắc bệnh và có nguy cơ
bị nhiễm bệnh.
- Lớp nhiễm bệnh I: Những người trong lớp này đã mắc bệnh và có khả năng
truyền bệnh sang người khác.
- Lớp hết bệnh R: Những người trong lớp này đã được trị khỏi bệnh hoặc đã chết vì
bệnh.
Với mơ hình SIR này, kết quả dự báo sẽ chính xác khi bệnh dịch xảy ra trong
khoảng thời gian ngắn để lượng dân số trong khu vực luôn ổn định, tính cả người đã
chết vì bệnh dịch này vào tổng số dân; chu kỳ ủ bệnh không đáng kể; tập mẫu dân số
đủ lớn để có kết quả xấp xỉ đúng. Mức độ lan truyền dịch bệnh được xác định như sau:
𝑇
𝛼
𝑆 + 𝐼 → 2𝐼 và 𝐼 → 𝑅
(1.1)
Trong đó:
𝑇
𝑆 + 𝐼 → 2𝐼: Ở vế trái, người trong lớp S bị người trong lớp I lây bệnh với tốc
độ r > 0, khiến người đó chuyển sang lớp I, thu được vế phải là 𝐼 + 𝐼 = 2𝐼.
𝛼
𝐼 → 𝑅: Người trong lớp I sau một thời gian sẽ hết bệnh (hoặc chết vì bệnh) và
chuyển sang lớp R với tốc độ 𝑎 > 0.
Mỗi lớp trong mơ hình SIR là một hàm số theo thời gian t gồm 𝑆(𝑡 ), 𝐼(𝑡) và 𝑅(𝑡).
Lớp nhiễm bệnh có tốc độ tỉ lệ thuận với số lượng người nhiễm bệnh và người dễ
bệnh, tức rSI, với 𝑟 > 0 là tham số hằng, đó cũng là tốc độ mất đi số người trong lớp
dễ bệnh. Tốc độ hết bệnh của người nhiễm bệnh tỉ lệ thuận với số lượng người nhiễm
bệnh, tức aI, với 𝑎 > 0 là hằng số, 1/𝑎 là độ đo thời gian một người ở trong trạng thái
nhiễm bệnh. Chu kỳ ủ bệnh ngắn, tức người dễ bệnh khi tiếp xúc với mầm bệnh sẽ
nhiễm bệnh ngay. Dựa trên các giá trị đầu vào, xác định được các tham số trong trong
phương trình này. Mơ hình kết quả được dùng để dự báo 𝑆(𝑡 ), 𝐼(𝑡) và 𝑅 (𝑡 ) với t là
thời gian tương lai. Mơ hình dịch tễ học tốn học có thể áp dụng thành công và cho kết
5
quả lý tưởng trên những hệ thống không quá phức tạp.
Trong thời gian gần đây, kỹ thuật và mơ hình phân tích chuỗi thời gian (timeseries) được sử dụng rộng rãi, nghiên cứu dự báo trong các lĩnh vực khác nhau và dự
báo diễn biến dịch bệnh trong tương lai. Việc sử dụng mô hình phân tích chuỗi thời
gian, khắc phục được các nhược điểm của mơ hình hồi quy luận lý (logistic), hồi quy
đa biến, do khơng thể xem xét tính tự tương quan của những dữ liệu mang tính chuỗi
thời gian, làm hạn chế khả năng dự đoán. Nhằm cải thiện độ chính xác trong thiết lập
mơ hình cảnh báo dịch bệnh, một số nhà nghiên cứu đã tiến hành kết hợp kỹ thuật
phân tích chuỗi thời gian và các mơ hình dự báo, nhằm xác định ảnh hưởng của điều
kiện địa lý, thời gian,… tới số ca mắc một bệnh nào đó. Từ các phân tích nêu trên, luận
văn thực hiện nghiên cứu kết hợp mơ hình ARIMA và với các kỹ thuật phân tích chuỗi
thời gian để thiết lập mơ hình dự báo thống nhất. Các kỹ thuật khai phá dữ liệu được
đề cập chi tiết tại Chương 2, nhằm đưa ra phân tích và lựa chọn kỹ thuật khai phá dữ
liệu phù hợp với chuỗi dữ liệu thời gian.
1.5. Mục tiêu nghiên cứu
Từ các phân tích ở trên luận văn này tập trung nghiên cứu hệ thống hóa các kỹ
thuật khai phá dữ liệu, lựa chọn các phương pháp phù hợp nhằm xây dựng mơ hình
giải quyết bài tốn phân tích và dự báo dự báo dịch bệnh truyền nhiễm. Mơ hình nhận
đầu vào là tập dữ liệu về tình hình dịch bệnh trong q khứ, và có đầu ra là mơ hình dự
báo diễn biến dịch bệnh trong tương lai, qua đó giúp nhận định chu kỳ, xu hướng diễn
biến của dịch bệnh.
Từ mục tiêu trên, luận văn tập trung nghiên cứu các vấn đề sau:
- Nghiên cứu tổng quan các phương pháp và kỹ thuật khai phá dữ liệu, lựa chọn
phương pháp thích hợp với tập dữ liệu dịch bệnh truyền nhiễm;
- Tiến hành thực nghiệm phân tích, dự báo dịch cúm với các phương pháp khai phá
dữ liệu được lựa chọn trên tập dữ liệu dịch cúm được cơng bố;
- Xây dựng mơ hình dự báo phù hợp và hiệu quả trong công tác dự báo dịch cúm
có khả năng ứng dụng cho tình hình thực tế ở Việt Nam.
Tóm tắt Chương 1
Chương 1 đã giới thiệu tổng quan các vấn đề của dịch bệnh truyền nhiễm, lịch sử
hình thành, phát triển của y tế dự phòng và thực trạng diễn biến dịch bệnh truyền
nhiễm hiện nay. Qua thực trạng đó, để thấy được tính cấp thiết trong việc ứng dụng
công nghệ thông tin trong phân tích, dự báo qua đó hỗ trợ cơng tác quản lý, định
hướng chính sách y tế để phòng ngừa và ngăn chặn diễn biến dịch bệnh. Bên cạnh đó,
cũng đề cập hiện trạng và phương pháp nghiên cứu ứng dụng phân tích, dự báo trong
lĩnh vực y tế đặc biệt là mảng y tế dự phòng.
6
Chương 2 của luận văn sẽ trình bày các phương pháp và cơng cụ phổ biến hiện nay
phục vụ khai thác dữ liệu, đề xuất lựa chọn một phương pháp phù hợp nhằm xử lý,
phân tích và dự báo tập dữ liệu về dịch bệnh cúm do Google Flu Trends cung cấp.
7