Carlos Francisco Méndez Cruz
Genómica Computacional Investigador Inv. Tit. A T.C. Interino SemblanzaCarlos-Francisco Méndez-Cruz estudió la Licenciatura en informática en la Universidad Nacional Autónoma de México (UNAM) y obtuvo su título en 1997. Trabajó para el Patronato universitario por siete años, comenzando como programador de computadoras y terminando como jefe del área de tecnología de información. Sus intereses se movieron hacia el Procesamiento de lenguaje natural y la Lingüística computacional y comenzó sus estudios de posgrado en 2005. Obtuvo grado de maestría y doctorado en lingüística de la UNAM. Su proyecto doctoral fue sobre aprendizaje no supervisado de la morfología del español y recibió su título doctoral en 2013. Hizo investigación postdoctoral en el Instituto de Ingeniería de la UNAM de 2014 a 2015 en perfilamiento de autor, procesamiento de noticias y el desarrollo de una biblioteca digital de arte mexicano. Actualmente tiene un puesto como Investigador asociado C en el Centro de Ciencias Genómicas de la UNAM dentro del Programa de Investigación en Genómica Computacional. El objetivo de su trabajo es la extracción de conocimiento de literatura biomédica mediante métodos de procesamiento de lenguaje natural y minería de textos. Este conocimiento extraído es usado por investigadores de ciencias de la vida para formular nuevos planes de investigación, y por biocuradores para alimentar bases de datos biológicas como RegulonDB. Sus proyectos en marcha son “Resumen automático de propiedades de factores transcripcionales”, “Extracción automática de interacciones regulatorias y condiciones de crecimiento” y “Extracción automática de eventos gene-enfermedad en enfermedades pulmonares”. También coordina el desarrollo de una nueva infraestructura de curación con capacidades de minería de textos como colaborador en un proyecto del Dr. Julio Collado (NIGMS-NIH). Ha sido profesor desde el 2000 en programas de maestría (Lingüística e Informática administrativa) y licenciatura (Lingüística, Ingeniería en computación, Informática). Sus últimos cursos impartidos han sido “Introducción al procesamiento de lenguaje natural en literatura biomédica” e “Introducción a la minería de textos en literatura biomédica” en la Licenciatura en Ciencias Genómicas. Adicionalmente, ha supervisado varias tesis de licenciatura y una de maestría. Recientemente participó con el capítulo “Procesamiento de lenguaje natural en la conservación de la herencia cultural: una red semántica del Popol Vuh”(Capítulo Patrimonio Digital), en el libro “Patrimonio Digital. Métodos computacionales y medios interactivos para estudiar y divulgar el patrimonio cultural” RedTDPC, INAH (Patrimonio Digital. Métodos computacionales y medios interactivos para estudiar y divulgar el patrimonio cultural). El capítulo muestra cómo técnicas de Procesamiento de lenguaje natural utilizadas en el Programa de Genómica Computacional del CCG para analizar literatura biomédica también pueden usarse en la descripción e interpretación de cualquier colección de documentos de herencia cultural, en este caso del Popol Vuh “libro de la comunidad”, que contiene narraciones culturales y mitológicas de tradición maya sobre la creación del mundo. LigasPublicaciones selectasDíaz-Rodríguez, M., Lithgow-Serrano, O., Guadarrama-García, F., Tierrafría, V.H., Gama-Castro, S., Solano-Lira, H., Salgado, H., Rinaldi, F., Méndez-Cruz, C.F., Collado-Vides, J.. (2021). *”Lisen&Curate: A platform to facilitate gathering textual evidence for curation of regulation of transcription initiation in bacteria.”.* * BBA-GENE REGUL MECH.* Méndez-Cruz, C.F., Blanchet, A., Godínez, A., Arroyo-Fernández, I., Gama-Castro, S., Martínez-Luna, S.B., González-Colín, C., Collado-Vides, J.. (2020). *”Knowledge extraction for assisted curation of summaries of bacterial transcription factor properties.”.* * DATABASE-THE JOURNAL OF BIOLOGICAL DATABASES AND CURATION.* *2020*():-. [doi:10.1093/database/baaa109] http://dx.doi.org/10.1093/database/baaa109 .
|
Teléfono: (777) 3132063
|
Publicaciones
Año | Publicación | PMID |
---|---|---|
2023 | Mendez-Cruz, Carlos-Francisco, Joel Rodríguez-Herrera, Alfredo Varela-Vega, Valeria Mateo-Estrada, Castillo Ramírez, Santiago. (2023). "Unsupervised Learning and Natural Language Processing Point Out Bias in Research Trends of a Superbug". Social Science Research Network. ():-. [doi:10.2139/ssrn.4503262] | |
2022 | Méndez Cruz, Carlos Francisco, Arroyo Fernández, Ignacio. (2022). "Análisis automático de unidades morfológicas: segmentación y agrupamiento en español, maya y náhuatl". Ámbitos Morfológicos. Descripciones y métodos. México: UNAM. ISBN 978-607-30-5946-6. ():-. | |
2022 | Tierrafría, V.H., Rioualen, C., Salgado, H., Lara, P., Gama-Castro, S., Lally, P., Gómez-Romero, L., Peña-Loredo, P., López-Almazo, A.G., Alarcón-Carranza, G., Betancourt-Figueroa, F., Alquicira-Hernández, S., Polanco-Morelos, J.E., García-Sotelo, J., Gaytan-Nuñez, E., Méndez-Cruz, C.F., Muñiz, L.J., Bonavides-Martínez, C., Moreno-Hagelsieb, G., Galagan, J.E., Wade, J.T., Collado-Vides, J.. (2022). "RegulonDB 11.0: Comprehensive high-throughput datasets on transcriptional regulation in Escherichia coli K-12.". Microbial genomics. 8(5):-. [doi:10.1099/mgen.0.000833] | 35584008 |
2021 | Arroyo-Fernández, Ignacio, Carrasco-Ruiz, Mauricio, Méndez, C.. (2021). "Procesamiento de lenguaje natural en la conservación de la herencia cultural: una red semántica del Popol Vuh". Patrimonio digital. Métodos computacionales y medios interactivos para estudiar y divulgar el patrimonio cultural. ():25-34. | |
2021 | Díaz-Rodríguez, M., Lithgow-Serrano, O., Guadarrama-García, F., Tierrafría, V.H., Gama-Castro, S., Solano-Lira, H., Salgado, H., Rinaldi, F., Méndez-Cruz, C.F., Collado-Vides, J.. (2021). "Lisen&Curate: A platform to facilitate gathering textual evidence for curation of regulation of transcription initiation in bacteria.". BIOCHIMICA ET BIOPHYSICA ACTA-GENE REGULATORY MECHANISMS. 1864(11-12):-. [doi:10.1016/j.bbagrm.2021.194753] | 34461312 |
2021 | Lithgow-Serrano O, Cornelius J, Kanjirangat V, Méndez-Cruz CF, Rinaldi F. (2021). "Improving classification of low-resource COVID-19 literature by using Named Entity Recognition.". Genomics & informatics. 19(3):-. [doi:10.5808/gi.21018] | 34638169 |
2020 | Méndez-Cruz, C.F., Blanchet, A., Godínez, A., Arroyo-Fernández, I., Gama-Castro, S., Martínez-Luna, S.B., González-Colín, C., Collado-Vides, J.. (2020). "Knowledge extraction for assisted curation of summaries of bacterial transcription factor properties.". DATABASE-THE JOURNAL OF BIOLOGICAL DATABASES AND CURATION. 2020():-. [doi:10.1093/database/baaa109] | 33306798 |
2020 | Jiménez-Jacinto V., Gómez-Romero, L., Méndez-Cruz CF. (2020). "Pattern Recognition Applied to the Analysis of Genomic Data and Its Association to Diseases". Pattern Recognition Techniques Applied to Biomedical Problems. ():31-61. | |
2019 | Santos-Zavaleta, A., Salgado, H., Gama-Castro, S., Sánchez-Pérez, M., Gómez-Romero, L., Ledezma-Tejeida, D., García-Sotelo, J.S., Alquicira-Hernández, K., Muñiz-Rascado, L.J., Peña-Loredo, P., Ishida-Gutiérrez, C., Velázquez-Ramírez, D.A., Del Moral-Chávez, V., Bonavides-Martínez, C., Méndez-Cruz, C.F., Galagan, J., Collado-Vides, J.. (2019). "RegulonDB v 10.5: tackling challenges to unify classic and high throughput knowledge of gene regulation in E. coli K-12". Nucleic Acids Research. 47(D1):212-220. [doi:10.1093/nar/gky1077] | 30395280 |
2019 | Arroyo Fernández, Ignacio, Méndez, C., Sierra, Gerardo, Sidorov, Grigori, Torres-Moreno, Juan-Manuel. (2019). "Unsupervised Sentence Representations as Word Information Series: Revisiting TF--IDF". COMPUTER SPEECH AND LANGUAGE. 56():107-129. [doi:10.1016/j.csl.2019.01.005] | |
2019 | Arroyo Fernández, Ignacio, Curiel, Arturo, Méndez, C.. (2019). "Language features in extractive summarization: Humans Vs. Machines". KNOWLEDGE-BASED SYSTEMS. 180():1-11. [doi:10.1016/j.knosys.2019.05.014] | |
2017 | Rinaldi F, Lithgow O, Gama-Castro S, Solano H, Lopez A, Muñiz Rascado LJ, Ishida-Gutiérrez C, Méndez-Cruz CF, Collado-Vides J. (2017). "Strategies towards digital and semi-automated curation in RegulonDB". DATABASE-THE JOURNAL OF BIOLOGICAL DATABASES AND CURATION. 2017(1):-. [doi:10.1093/database/bax012] | 28365731 |
2017 | Méndez-Cruz CF, Gama-Castro S, Mejía-Almonte C, Castillo-Villalba MP, Muñiz-Rascado LJ, Collado-Vides J. (2017). "First steps in automatic summarization of transcription factor properties for RegulonDB: classification of sentences about structural domains and regulated processes". DATABASE-THE JOURNAL OF BIOLOGICAL DATABASES AND CURATION. 2017():-. [doi:10.1093/database/bax070] | 29220462 |
2016 | Mendez-Cruz, Carlos-Francisco, Medina-Urrea, Alfonso, Sierra, Gerardo. (2016). "Unsupervised morphological segmentation based on affixality measurements". PATTERN RECOGNITION LETTERS. 84():127-133. [doi:10.1016/j.patrec.2016.09.001] | |
2013 | . (2013). "Extrinsic Evaluation on Automatic Summarization Tasks. Testing Affixality Measurements for Statistical Word Stemming". MICAI 2012: Advances in Computational Intelligence. II():46-57. | |
2011 | . (2011). "The GIL-UNAM-3 summarizer: an experiment in the track QA@ INEX’10". INEX 2010: Comparative Evaluation of Focused Retrieva. 6932():282-289. | |
2006 | . (2006). "Arquitectura del Corpus Histórico del Español de México (CHEM)". Avances en la Ciencia de la Computación. ():248-253. | |
2005 | . (2005). "Extractive summarization based on word information and sentence position". Computational Linguistics and Intelligent Text Processing. ():653-656. | |
2004 | . (2004). "CLI: An Open Linguistic Corpus for Engineering". Proceedings of IX Ibero-American Workshop on Artificial Intelligence. ():203-208. |