Structuring electronic health records of breast cancer with Natural Language Processing
Loading...
Official URL
Full text at PDC
Publication date
2023
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Clinical records are written in natural language and, therefore, they consist of unstructured information. The objective of the project is to structure the information from clinical records of breast cancer patients in a public hospital in Madrid in order to obtain useful information for physicians. In this way, the proposal is to perform the structuring process using deep neural networks for entity classification, specifically Named Entity Recognition (NER), in combination with other NLP techniques. Ultimately, a semi-structured database in JSON format will be generated, containing the structured clinical records, which can be further processed for various purposes.
Description
Los historiales clínicos están escritos en lenguaje natural y, por tanto, es información no estructurada. El objetivo del proyecto es estructurar la información de historiales clínicos de pacientes con cáncer de mama de un hospital público de Madrid con el fin de conseguir información útil para los médicos. De esta forma, se propone realizar la estructuración a través del uso de redes neuronales profundas para la clasificación de las entidades: NER (Named Entity Recognition), en conjunto con otras técnicas de NLP. Finalmente se generará una base de datos semiestructurada en formato json con los historiales, que podrá ser procesada posteriormente con diferentes intenciones.