Ứng dụng trí tuệ nhân tạo trong tái lập tín hiệu điện tâm đồ

Bài viết "Ứng dụng trí tuệ nhân tạo trong tái lập tín hiệu điện tâm đồ" do Nguyễn Thị Thu Hồng (Khoa Ứng dụng phần mềm, Trường Cao đẳng FPT Thành phố Hồ Chí Minh) và Trương Quốc Trí (Khoa Kỹ thuật Cơ - Điện và Máy tính, Trường Đại học Văn Lang) thực hiện.

Tóm tắt:

Các bệnh lý tim mạch như rối loạn nhịp tim, đột quỵ tim thường được phát hiện trễ và là nguyên nhân gây tử vong hàng đầu. Tích hợp trí tuệ nhân tạo trong các thiết bị y tế đóng vai trò quan trọng trong việc phát hiện và chẩn đoán sớm bệnh. Trong nghiên cứu này, nhóm tác giả sử dụng mô hình các dấu hiệu bất thường Reservoir Computing nhằm tái lập tín hiệu điện tâm đồ và qua đó nhằm phát hiện của tim. Trong các mô hình tái lập dữ liệu chuỗi thời gian, mô hình Reservoir Computing có ưu điểm hơn các mạng nơ-ron truyền thống ở khả năng sử dụng dữ liệu ít nhưng vẫn cho độ chính xác cao. Nhóm tác giả huấn luyện mô hình trên tập dữ liệu MIT-BIH Arrhythmia Database. Kết quả huấn luyện cho thấy tiềm năng dự đoán tín hiệu điện tim trong khoảng thời gian ngắn.

Từ khóa: trí tuệ nhân tạo, mô hình Reservoir Computing, điện tâm đồ MIT-BIH Arrhythmia Database.

1. Đặt vấn đề

Điện tâm đồ (Electrocardiogram - ECG) là một công cụ hữu ích trong phân tích sức khỏe tim mạch [1, 13, 15]. Ứng dụng trí tuệ nhân tạo trong việc phát hiện và phân loại những dấu hiệu bất thường liên quan đến các bệnh về tim như: rối loạn tim, ngất đột ngột hoặc đột quỵ nhận được nhiều sự quan tâm của các nhà khoa học [3, 5-8, 11, 14]. Trong nghiên cứu [6], nhóm tác giả sử dụng kết hợp 2 thuật toán Trí tuệ nhân tạo là Support Vector Machine (SVM) và K-Nearest Neighbor (KNN) nhằm phân loại những tín hiệu bình thường và bất thường của điện tim. Bài báo đã đưa ra giải thuật giúp loại bỏ những tín hiệu nhiễu trong ECG và trích xuất những giá trị đặc trưng của tín hiệu phi tuyến đặc thù của điện tim. Mô hình của nhóm có khả năng phân loại với độ chính xác đến 99%. Trong khi đó, Hannun và đồng nghiệp đưa ra một mô hình trí tuệ nhân tạo khác dựa trên kỹ thuật học sâu (Deep Learning) [6, 7]. Mô hình này sử dụng tập dữ liệu lớn gồm 91,323 tín hiệu ECG của 53,549 bệnh nhân. Những nghiên cứu trên còn hạn chế do tín hiệu điện tim của bệnh nhân thường thay đổi trong những khoảng thời gian khác nhau. Do vậy, dựa vào những dấu hiệu bất thường của tim chỉ thông qua việc phân tích hình ảnh, cụ thể là hình ảnh ECG có thể dẫn đến việc sai sót trong phát hiện bệnh. Những năm gần đây, nhằm tăng mức độ chính xác trong việc chẩn đoán bệnh, các nhà khoa học ứng dụng trí tuệ nhân tạo nhằm tái lập mô hình ECG của bệnh nhân dựa vào dữ liệu được thu thập qua những khoảng thời gian khác nhau [3, 13-15]. Mạng nơ-ron hồi quy (Recurrent Neural Network) được nhiều nhà khoa học quan tâm và phát triển trong việc phân tích các tín hiệu phi tuyến như tín hiệu điện tâm đồ [9, 16]. Trong đó, mô hình Reservoir Computing - một dạng đặc thù của mạng nơ-ron hồi quy thường được sử dụng trong việc tái lập tín hiệu chuỗi thời gian. Mô hình này có ưu điểm có thể tái lập được mô hình chuỗi thời gian với mức độ chính xác cao nhưng sử dụng lượng dữ liệu không quá
lớn. Tuy nhiên, việc ứng dụng mô hình toán học này trong tái lập tín hiệu điện tâm đồ theo thời gian thực chưa nhận được nhiều quan tâm. Việc tái lập tín hiệu điện tâm đồ theo thời gian thực có nhiều ý nghĩa trong việc phát triển những thiết bị y khoa có thể kiểm soát tình trạng tim mạch thực tế của bệnh nhân.

2. Ứng dụng trí tuệ nhân tạo trong tái lập quỹ đạo điện tâm đồ

2.1. Mô hình Reservoir Computing

Hình 1: Mô hình Reservoir Computing trong 2 quá trình gán nhãn và huấn luyện

tri tue nhan tao

Reservoir Computing (RC) là một mô hình đặc thù trong mạng nơ-ron hồi quy. Mô hình này thường được dùng trong việc tái lập quỹ đạo nghiệm các mô hình phi tuyến tính [5, 9, 10, 12, 14, 16-18]. Hình 1 mô tả cấu trúc tổng quát của mô hình. RC là mô hình học có giám sát, tức dữ liệu cần được gán nhãn trước khi được đưa vào huấn luyện mô hình [2]. Trong đó, tập dữ liệu ban đầu thường sẽ được chia làm 2 phần: Tập huấn luyện và Tập kiểm tra. Tuy nhiên, ưu điểm của mô hình RC là có thể vừa huấn luyện mô hình và vừa tạo tập dữ liệu. Tập dữ liệu mới có thể được xem là tập dữ liệu đã được "gán nhãn" như các mô hình học có giám sát truyền thống. Mô hình này gồm 2 quy trình riêng biệt như quan sát trong Hình 1a và Hình 1b.

  • Gán nhãn dữ liệu: Từng giá trị của Tập huấn luyện được đưa vào mô hình tại đầu vào x(t). Tại  đầu ra mô hình thu được tập dữ liệu đã được "gán nhãn" X (t) .
  • Huấn luyện mô hình: Từng giá trị của Tập kiểm tra được đưa vào mô hình tại đầu vào x(t). Tại đầu ra mô hình thu được giá trị dự đoán yˆ(t). Giá trị dự đoán này được tính toán dựa vào Tập kiểm tra và cả tập X (t) thu được từ quy trình trên. Sau đó, giá trị yˆ(t) được hồi quy tại đầu vào và tiếp tục kết hợp với giá trị x(t) để tính giá trị dự đoán yˆ(t + 1).

Cấu trúc chi tiết của mô hình RC được mô tả như trong Hình 2. RC gồm 5 thành phần chính gồm: đầu vào x(t), khối Input-to-Reservoir, khối Reservoir, khối Reservoir -to-Output và đầu ra yˆ(t). Đầu vào x(t) được cho vào mạng thông qua khối Input-to-Reservoir. Trong khối này Winx(t) được kết hợp vào trạng thái Reservoir r(t) để tạo nên đầu ra Reservoir là r(t + ∆t) như bên dưới:

   r(t + ∆t) = tanh[Ar(t) + Winx(t)]                                           (1)

Trong đó, A và Win lần lượt là ma trận kề và ma trận trọng số đầu vào. Những giá trị này được chọn ngẫu nhiên từ ban đầu. 

Hình 2: Cấu trúc tổng quát mô hình Reservoir Computing

tri tue nhan tao

Trạng thái Reservoir r(t + ∆t) được kết hợp với ma trận tham số được định nghĩa bởi P thông qua khối Reservoir-to-Output. Hơn nữa, Wout kết nối vector r(t + ∆t) với đầu ra yˆ(t) qua công thức:

 yˆ(t) = Wout (r(t + ∆t), P)      (2)

Tại đầu ra, mô hình nhận giá trị dự đoán yˆ(t),  giá trị này càng gần giá trị thực y(t) sẽ thể hiện mô hình được thiết kế và huấn luyện tốt. Trong nghiên cứu này, nhóm tác giả sử dụng một lượng giới hạn dữ liệu là 10.000 giá trị của biến hệ thống làm Tập huấn luyện. Có 20.000 dữ liệu còn lại cho Tập kiểm tra nhằm kiểm chứng mức độ hiệu quả của mô hình.

2.2. Tái lập tín hiệu điện tâm đồ

Trong nghiên cứu này nhóm tác giả sử dụng tập dữ liệu MIT-BIH Arrhythmia Database nhằm phân tích và tái lập tín hiệu ECG [4]. Tập dữ liệu này gồm 47 tín hiệu ECG của người trưởng thành bao gồm cả bệnh nhân và người bình thường ở các độ tuổi khác nhau. Mỗi dữ liệu ghi nhận tín hiệu điện tim liên tục trong 48 giờ. Dữ liệu được lấy mẫu rời rạc với tốc độ lấy mẫu là 360 mẫu trong 1 giây. Tập dữ liệu gồm 2 kênh chính trong 12 chuyển đạo điện tâm đồ là kênh V 5 và V 2. Lưu ý rằng, tỉ lệ lấy mẫu là 360 sample/s và mỗi bệnh nhận được lấy mẫu liên tục trong 48 giờ. Do vậy, mỗi dữ liệu trong số 48 dữ liệu thuộc tập MIT-BIH Arrhythmia Database sẽ có khoảng 62.208.000 giá trị rời rạc đặc trưng cho tín hiệu xung điện của tim. Trong thí nghiệm thực tế, nhóm tác giả sử dụng 30.000 tín hiệu ECG, tương ứng với 80s cho việc huấn luyện mô hình RC. Tín hiệu ECG thực tế là những tín hiệu xung điện được đo bằng mV. Do vậy, để phù hợp trong huấn luyện mô hình trí tuệ nhân tạo nhóm tác giả chuẩn hóa dữ liệu về khoảng [ -1, 1].

Có 30.000 giá trị rời rạc của tín hiệu ECG sau khi được xử lý sẽ được đưa vào huấn luyện trong Hình 1a, những giá trị này được đưa vào x(t). Tại ngõ ra X (t), mô hình thu được 10000 giá trị đã học được những đặc tính cơ bản của hệ. Lưu ý rằng, giá trị X (t) và giá luyện mô hình RC. Trong đó, 10.000 giá trị sẽ đưa vào tập huấn luyện. Như mô tả trị x(t) được kết hợp để tính Wout được dùng trong phương trình 2. Có 20.000 giá trị còn lại từng giá trị trong 20.000 giá trị lần lượt được đưa vào mô hình qua Khối Input x(t). Theo phương trình 2, mô hình sẽ tính toán từng giá trị y(t) tương ứng. Giá trị thu được hồi được sử dụng để mô hình RC dự đoán giá trị ECG ở đầu ra. Như mô tả trong Hình 1b, quy vào ngõ vào và kết hợp với x(t) để tính toán giá trị tiếp theo tại yˆ(t + 1). Quá trình này lặp lại cho đến giá trị thứ 20.000. Như vậy, tại đầu ra của mô hình chúng ta thu được 20.000 giá trị bằng với số lượng giá trị đầu vào.

Giá trị huấn luyện và giá trị dự đoán cho 2000 tín hiệu đầu tiên được biểu diễn lần lượt bằng đường màu đen và xanh dương trên Hình 3. Trong kết quả mô phỏng này trạng thái Reservoir được xây dựng bởi đồ thị gồm 100 nốt điểm (Reservoir Size = 100) và giá trị riêng lớn nhất của ma trận nhận được từ đồ thị sẽ cố định (p = 0.4). Như chúng ta thấy trong Hình, tín hiệu dự đoán gần khớp với tín hiệu thực tế trong khoảng 100 giá trị đầu tiên. Sau đó, quỹ đạo dự đoán bắt đầu có sự sai khác và giảm dần về biên độ. Tuy nhiên, tín hiệu dự đoán vẫn giữ được quỹ đạo có tính chu kỳ.

Hình 3: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) với Reservoir Size = 100, p = 0.4

tri tue nhan tao

Hình 4: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) trong 50 tín hiệu đầu tiên với Reservoir Size 90, p  = 0.4

tri tue nhan tao

Nhóm tác giả cũng khảo sát mức độ ảnh hưởng của số lượng nốt điểm (Reservoir Size) mô hình. Cụ thể như cố định p = 0.4 và thay đổi nhỏ về trạng thái Reservoir ở Reservoir trong trạng thái Reservoir và trị riêng lớn nhất của ma trận kề (p) đến giá trị đầu ra của Size=90 thì mức độ chính xác của mô hình rất thấp như quan sát trong Hình 4. Quỹ đạo Reservoir Size=100 và thay đổi p = 0.45 thì quỹ đạo dự đoán tách khỏi quỹ đạo thực tế dự đoán nhanh chóng tách khỏi quỹ đạo thực tế ở tín hiệu 50. Hình 5 nhóm tác giả cố định ở những tín hiệu đầu tiên.

4. Kết luận

Trong nghiên cứu này, nhóm tác giả sử dụng mô hình Reservoir Computing, một kỹ thuật mở rộng của mạng nơ-ron hồi quy trong lĩnh vực trí tuệ nhân tạo, nhằm tái lập tín hiệu điện tâm đồ. Nổi bật hơn các mạng nơ-ron hồi quy truyền thống, mô hình Reservoir Computing có ưu điểm chỉ sử dụng một lượng dữ liệu huấn luyện nhỏ. Tập dữ liệu điện tâm đồ dùng huấn luyện mô hình gồm 30.000 tín hiệu chọn lọc từ tập dữ liệu MIT-BIH Arrhythmia Database. Kết quả cho thấy mô hình dự đoán tốt cho khoảng 100 tín hiệu đầu tiên. Trong quá trình mô phỏng, khi thay đổi cấu trúc mạng về số lượng Reservoir Size và trị riêng lớn nhất của ma trận kề thì mô hình dự đoán sai quỹ đạo nghiệm ngay từ những giá trị đầu. Những thay đổi dù rất nhỏ các giá trị tham số này nhưng lại có ảnh hưởng rất lớn đến độ chính xác của mô hình. Trong tương lai, tác giả tập trung nghiên cứu các hướng sau: (Hình 5)

Hình 5: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) trong 50 tín hiệu đầu tiên với Reservoir Size = 100, p  = 0.4

tri tue nhan tao
  • Phân tích tác động của các thành phần tạo nên khối Khối Reservoir đến độ chính xác của mô hình. Các thành phần được xem xét là Reservoir Size và trị riêng lớn nhất.
  • Tối ưu các giá trị Reservoir Size và trị riêng lớn nhất.
  • So sánh tác động của các mạng đồ thị khác nhau như: Mạng ngẫu nhiên Erdo˝s - Rényi, Mạng phân cụm trong Khối Reservoir đến kết quả đầu ra của mô hình Reservoir
  • Xác định số lượng tín hiệu ECG lớn nhất mà mô hình trí tuệ nhân tạo có thể tái lập trước khi bị lệch khỏi quỹ đạo.

 

Tài liệu tham khảo:

  1. Ajam, M., Abu-Heija, A.A., Shokr, M., Ajam, , Saydain, G. (2019). Sinus bradycardia and qt interval prolongation in west nile virus encephalitis: A case report. Cureus,11(1).
  2. Caruana, R., Niculescu-Mizil, A. (2006). An empirical comparison of supervised learning algo- Proceedings of the 23rd international conference on Machine learning, 161- 168.
  3. Engin, (2004). Ecg beat classification using neuro-fuzzy network. Pattern Recognition Letters, 25(15), 1715-1722.
  4. Goldberger, A., Amaral, L., Glass, L., Hausdorff, J., Ivanov, P.C., Mark, R., Mietus, J., Moody, , Peng, C., Stanley, H. (2000). Components of a new research resource for complex phys- iologic signals. PhysioBank, PhysioToolkit, and Physionet, Circulation, 101(23):E215-20. doi: 10.1161/01.cir.101.23.e215.
  5. Hadaeghi, (2019). Reservoir computing models for patient-adaptable ecg monitoring in wearable devices. arXiv preprint arXiv:1907.09504. https://doi.org/10.48550/arXiv.1907.09504
  6. Hammad, M., Maher, A., Wang, , Jiang, F., Amrani, M. (2018). Detection of abnormal heart conditions based on characteristics of ecg signals. Measurement, 125, 634-644.
  7. Hannun, Y., Rajpurkar, P., Haghpanahi, M., Tison, G.H., Bourn, C., Turakhia, M.P., Ng, A.Y. (2019). Cardiologist-level arrhythmia detection and classification in ambulatory electrocardio- grams using a deep neural network. Nature medicine, 25(1), 65-69.
  8. Hu, , Chen, Y., Keogh, E. (2013). Time series classification under more realistic assumptions. In: Proceedings of the 2013 SIAM international conference on data mining. pp. 578-586. SIAM. Avaiable at: https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=8174e2f946dff9121f9ede714cd8cc15dd9d7630.
  9. Jaeger, , Haas, H. (2004). Harnessing nonlinearity: Predicting chaotic systems and saving energy in wireless communication. Science, 304(5667), 78-80.
  10. Krishnagopal, S., Girvan, M., Ott, E., Hunt, B.R. ((2020). Separation of chaotic signals by reservoir computing. Chaos, 30(2), 023123.
  11. LeCun, , Bengio, Y., Hinton, G. (2015). Deep learning. Nature, 521(7553), 436-444.
  12. Lu, Z., Hunt, B.R., Ott, E. (2018). Attractor reconstruction by machine learning. Chaos: An Interdisciplinary Journal of Nonlinear Science, An Inter-disciplinary. Journal of Nonlinear Science, 28(6), 061104.
  13. Mahapatra, , Mohanta, D., Mohanty, P., kumar Nayak, S., kumar Behari, P. (2016). A neuro-fuzzy based model for analysis of an ecg signal using wavelet packet tree. Procedia Computer Science, 92, 175-180.
  14. Mastoi, Q.U.A., Wah, Y., Gopal Raj, R. (2019). Reservoir computing based echo state networks for ventricular heart beat classification. Applied Sciences, 9(4), 702.
  15. Moody, G.B., Mark, R.G. (1990). The mit-bih arrhythmia database on cd-rom and software for use with it. In: [1990] Proceedings Computers in Cardiology. pp. 185–188. IEEE. Avaiable at: https://ecg.mit.edu/george/publications/mitdb-cinc-1990.pdf.
  16. Pathak, J., Hunt, B., Girvan, M., Lu, Z., Ott, E. (2018). Model-free prediction of large spatiotem- porally chaotic systems from data: A reservoir computing approach. Physical review letters, 120(2), 024102.
  17. Pathak, , Lu, Z., Hunt, B.R., Girvan, M., Ott, E. (2017). Using machine learning to replicate chaotic attractors and calculate lyapunov exponents from data. Chaos: An Interdisciplinary Journal of Nonlinear Science, 27(12), 121102.
  18. Vlachas, R., Pathak, J., Hunt, B.R., Sapsis, T.P., Girvan, M., Ott, E., Koumoutsakos, P. (2020). Backpropagation algorithms and reservoir computing in recurrent neural networks for the forecasting of complex spatiotemporal dynamics. Neural Networks, 126, 191-217.

 

Using artificial intelligence to reconstruct electrocardiogram signals

Nguyen Thi Thu Hong1

Truong Quoc Tri2

1Faculty of Software Applications, FPT College Ho Chi Minh City

2Faculty of Mechanical - Electrical and Computer Engineering, Van Lang University

Abstract:

Cardiovascular diseases such as arrhythmia and myocardial infarction are often detected late, leading to mortality. Integrating artificial intelligence (AI) into medical devices is crucial for the early detection and diagnosis of these diseases. In this study, the Reservoir Computing model of abnormal signals is used to reconstruct electrocardiogram signals and detect heart abnormalities. Among time series data reconstruction models, the Reservoir Computing model has advantages over traditional neural networks as it uses less data but still has high accuracy. The model is trained on the MIT-BIH Arrhythmia Database. The training results demonstrate the potential for predicting cardiac electrical signals in a short time.

Keywords: artificial intelligence, Reservoir Computing model, electrocardiogram MIT-BIH Arrhythmia Database.

[Tạp chí Công Thương - Các kết quả nghiên cứu khoa học và ứng dụng công nghệ, Số 20 tháng 9 năm 2023]