{"id":506,"date":"2022-09-09T15:54:24","date_gmt":"2022-09-09T20:54:24","guid":{"rendered":"http:\/\/blog.espol.edu.ec\/jjlainez\/?page_id=506"},"modified":"2022-09-11T19:49:53","modified_gmt":"2022-09-12T00:49:53","slug":"articulodeteccion-de-temperatura-corporal-mediante-imagenes-de-rostro-usando-una-camara-telefono-inteligente-para-la-contencion-de-covid-19-utilizando-una-red-neuronal-convolucional-cnny-maquina-de","status":"publish","type":"page","link":"https:\/\/blog.espol.edu.ec\/jjlainez\/articulodeteccion-de-temperatura-corporal-mediante-imagenes-de-rostro-usando-una-camara-telefono-inteligente-para-la-contencion-de-covid-19-utilizando-una-red-neuronal-convolucional-cnny-maquina-de\/","title":{"rendered":"Detecci\u00f3n de temperatura corporal mediante im\u00e1genes de rostro usando una c\u00e1mara tel\u00e9fono inteligente para la contenci\u00f3n de COVID-19 utilizando una red neuronal convolucional (CNN)y maquina de vector de soporte (SVM)"},"content":{"rendered":"<div id=\"pl-506\"  class=\"panel-layout\" ><div id=\"pg-506-0\"  class=\"panel-grid panel-no-style\" ><div id=\"pgc-506-0-0\"  class=\"panel-grid-cell\" ><div id=\"panel-506-0-0-0\" class=\"so-panel widget widget_sow-editor panel-first-child panel-last-child\" data-index=\"0\" ><div\n\t\t\t\n\t\t\tclass=\"so-widget-sow-editor so-widget-sow-editor-base\"\n\t\t\t\n\t\t>\n<div class=\"siteorigin-widget-tinymce textwidget\">\n\t<p style=\"text-align: center\"><em>Juan Jos\u00e9 La\u00ednez Bola\u00f1os<\/em><\/p>\n<p style=\"text-align: center\"><em>jjlainez@espol.edu.ec<\/em><\/p>\n<p><a href=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/Articulo-JJLB.pdf\">Version pdf<\/a><\/p>\n<\/div>\n<\/div><\/div><\/div><\/div><div id=\"pg-506-1\"  class=\"panel-grid panel-no-style\" ><div id=\"pgc-506-1-0\"  class=\"panel-grid-cell\" ><div id=\"panel-506-1-0-0\" class=\"so-panel widget widget_sow-editor panel-first-child panel-last-child\" data-index=\"1\" ><div\n\t\t\t\n\t\t\tclass=\"so-widget-sow-editor so-widget-sow-editor-base\"\n\t\t\t\n\t\t>\n<div class=\"siteorigin-widget-tinymce textwidget\">\n\t<p><strong><em>Resumen<\/em><\/strong>\u2014 <em>En este proyecto, proponemos contener el COVID-19 y otras enfermedades\u00a0contagiosas usando una APP obtenie<\/em><em>n<\/em><em>do la temperatura corporal a partir de una foto de una c\u00e1mara\u00a0digital, una c\u00e1mara\u00a0web de un computador o una c\u00e1mara\u00a0de un tel\u00e9fono\u00a0inteligente, siendo como objetivo extraer caracter\u00edsticas faciales con un modelo de red neuronal convolucional (CNN) y entrenar un clasificador de m\u00e1quina de vector de soporte (SVM) para predecir la temperatura a partir de una imagen.<\/em> <em>CNN es un tipo especial de redes neuronales multicapa dise\u00f1adas para reconocer patrones visuales directamente de las im\u00e1genes naturales de p\u00edxeles, mientras que SVM puede realizar de manera eficiente una clasificaci\u00f3n no lineal, especialmente con un peque\u00f1o conjunto de datos. El resto de este documento est\u00e1 organizado de la siguiente manera:La Secci\u00f3n\u00a01 Introducci\u00f3n <\/em><em>, <\/em><em>La Secci\u00f3n 2 Procesamiento de la imagen<\/em><em>,<\/em><em>La Secci\u00f3n 3 Modelo de CNN y SVM<\/em><em>, <\/em><em>La secci\u00f3n 4 Metodolog\u00eda y resultados<\/em><em>, <\/em><em>La secci\u00f3n 5 Conclusiones<\/em> .<\/p>\n<p>Keywords\u2014COVID-19, CNN, SVM<\/p>\n<h3><span style=\"color: #0000ff\"><strong>I. Introducci\u00f3n\u00a0\u00a0<\/strong><\/span><\/h3>\n<p>El\u00a0 coronavirus (COVID-19) se est\u00e1 extendiendo r\u00e1pidamente por todo el mundo desde diciembre de 2019. Una de las medidas de contenci\u00f3n es el monitoreo de lo\u00a0 s\u00edntomas m\u00e1s comunes en un poblaci\u00f3n. La temperatura del cuerpo humano es un signo vital importante y varias enfermedades se caracterizan por un cambio en la temperatura corporal. La\u00a0fiebre, que es uno de los s\u00edntomas m\u00e1s importantes del COVID-19, es un aumento temporal de la temperatura corporal. Es una parte de la respuesta general del sistema inmunitario del cuerpo. Por lo general, la\u00a0fiebre\u00a0se debe a una infecci\u00f3n. El rango normal de temperatura del cuerpo humano generalmente se establece como 36,5 a 37,5 \u00b0C.<\/p>\n<p>Actualmente la temperatura se mide con varios\u00a0 tipos de term\u00f3metros m\u00e9dicos, ver Figura 1, as\u00ed como lugares en el cuerpo utilizados para la medici\u00f3n. Una forma t\u00edpica es poner un term\u00f3metro digital en la boca (temperatura oral). Esto es relativamente conveniente en contraste con la medici\u00f3n de la temperatura axilar o la temperatura rectal. Sin embargo, todas estas mediciones se realizan por contacto, lo que no es adecuado para monitorear una multitud de enfermedades contagiosas. Dada la pandemia es importante que la temperatura corporal sea de\u00a0 una medicion sin contacto un term\u00f3metro frontal infrarrojo sin contacto es un dispositivo port\u00e1til asequible para medir la temperatura individual, mientras que un sistema de c\u00e1mara t\u00e9rmica es viable (pero muy costoso) para monitorear multitudes en sitios p\u00fablicos, por ejemplo, en centros comerciales, aeropuertos , universidades.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-507 size-full\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/AJJ1.png\" alt=\"\" width=\"700\" height=\"568\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/AJJ1.png 700w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/AJJ1-300x243.png 300w\" sizes=\"auto, (max-width: 700px) 100vw, 700px\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>Figura 1. Equipos para la medici\u00f3n de temperatura, a. term\u00f3metro anal\u00f3gico, term\u00f3metro digital de contacto, c. term\u00f3metro infrarrojo, d. c\u00e1mara t\u00e9rmica.<\/p>\n<h2><\/h2>\n<h3><span style=\"color: #0000ff\"><strong>II. Procesamiento de Im\u00e1genes<\/strong><\/span><\/h3>\n<p>El proceso completo se divide en tres pasos: obtenci\u00f3n de imagen, detecci\u00f3n de rostros, extracci\u00f3n de caracter\u00edsticas y\u00a0 reconocimiento de temperatura de rostros. La detecci\u00f3n de rostros se centra en la detecci\u00f3n de rostros humanos frontales. Las t\u00e9cnicas de extracci\u00f3n de caracter\u00edsticas ayudan a localizar y extraer caracter\u00edsticas faciales \u00fanicas. El sistema de reconocimiento facial utiliza m\u00e9todos basados \u200b\u200ben aprendizaje autom\u00e1tico para clasificar las caracter\u00edsticas extra\u00eddas en una de las clases (perteneciente a un individuo en particular) en la base de datos.<\/p>\n<p>La obtenci\u00f3n de la imagen para el procesamiento es por medio de una c\u00e1mara digital de cctv, un c\u00e1mara web de computadora o una c\u00e1mara de tel\u00e9fono inteligente. Esta imagen se env\u00eda a una ubicaci\u00f3n en el servidor para ser procesada por el algoritmo del software que utiliza la CNN y la SVM. La detecci\u00f3n de rostros consiste en localizar el rostro en la imagen, lo cual es un paso importante para el proceso sucesivo. Se han desarrollado numerosas t\u00e9cnicas para detectar rostros en una sola imagen, por ejemplo, m\u00e9todos basados en el conocimiento, enfoques faciales invariantes de caracter\u00edsticas, m\u00e9todos de coincidencia de plantillas, m\u00e9todos basados en la apariencia.<\/p>\n<p>Muchos m\u00e9todos utilizan informaci\u00f3n de color, es decir, identifican las regiones (mapa de piel) cuyo color es similar al color de la piel, lo que puede restringir significativamente el \u00e1rea de b\u00fasqueda.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-515 size-large\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj2-1024x588.png\" alt=\"\" width=\"1024\" height=\"588\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj2-1024x588.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj2-300x172.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj2-768x441.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj2.png 1586w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 2. Procesamiento de Im\u00e1genes<\/p>\n<p>&nbsp;<\/p>\n<p>Uno de los algoritmos m\u00e1s exitosos en im\u00e1genes visuales es el algoritmo Viola-Jones\u00a0 propuesto en 2001. Los m\u00e9todos de detecci\u00f3n de rostros est\u00e1n bien desarrollados y marcan r\u00e1pidamente m\u00faltiples rostros en una imagen, independientemente de sus tama\u00f1os y fondos, utilizando cambios espaciales. El algoritmo Viola-Jones (VJ) se ha convertido en un m\u00e9todo muy com\u00fan de detecci\u00f3n de objetos, incluida la detecci\u00f3n de rostros.<\/p>\n<p>Viola y Jones propusieron este algoritmo como un enfoque de aprendizaje autom\u00e1tico para la detecci\u00f3n de objetos con \u00e9nfasis en obtener resultados r\u00e1pidamente y con altas tasas de detecci\u00f3n.<\/p>\n<h1><\/h1>\n<h3><span style=\"color: #0000ff\">III. Modelo CNN y SVM<\/span><\/h3>\n<h3><span style=\"color: #0000ff\">A.\u00a0\u00a0 CNN MTCNN<\/span><\/h3>\n<p>Las redes convolucionales en cascada multitarea (MTCNN) es un marco desarrollado como una soluci\u00f3n tanto para la detecci\u00f3n de rostros como para la alineaci\u00f3n de rostros. El proceso consta de tres etapas de redes convolucionales que pueden reconocer rostros y ubicaciones de puntos de referencia, como ojos, nariz y boca. El documento propone MTCNN como una forma de integrar ambas tareas (reconocimiento y alineaci\u00f3n) utilizando el aprendizaje multitarea. En la primera etapa, utiliza una CNN poco profunda para producir r\u00e1pidamente ventanas candidatas. En la segunda etapa refina las ventanas candidatas propuestas a trav\u00e9s de una CNN m\u00e1s compleja. Y, por \u00faltimo, en la tercera etapa utiliza una tercera CNN, m\u00e1s compleja que las dem\u00e1s, para refinar a\u00fan m\u00e1s el resultado y generar posiciones de puntos de referencia faciales.<\/p>\n<ul>\n<li><em>Etapa 1: La Red de Propuestas (P-Net)<\/em><\/li>\n<\/ul>\n<p>Esta primera etapa es una red totalmente convolucional (FCN). La diferencia entre una CNN y una FCN es que una red totalmente convolucional no utiliza una capa densa como parte de la arquitectura. Esta red de propuestas se utiliza para obtener ventanas candidatas y sus vectores de regresi\u00f3n de cuadro delimitador.<\/p>\n<p>La regresi\u00f3n de cuadro delimitador es una t\u00e9cnica popular para predecir la localizaci\u00f3n de cuadros cuando el objetivo es detectar un objeto de alguna clase predefinida, en este caso caras. Despu\u00e9s de obtener los vectores del cuadro delimitador, se realiza un refinamiento para combinar.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-522\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/Pnet.png\" alt=\"\" width=\"866\" height=\"436\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/Pnet.png 866w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/Pnet-300x151.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/Pnet-768x387.png 768w\" sizes=\"auto, (max-width: 866px) 100vw, 866px\" \/><\/p>\n<p style=\"text-align: center\">Figura 3. Procesamiento de Im\u00e1genes, P-Net<\/p>\n<ul>\n<li><em>Etapa 2: La red Refine (R-Net)<\/em><\/li>\n<\/ul>\n<p>Todos los candidatos de P-Net ingresan a Refine Network. Tenga en cuenta que esta red es una CNN, no una FCN como la anterior, ya que hay una capa densa en la \u00faltima etapa de la arquitectura de la red. R-Net reduce a\u00fan m\u00e1s el n\u00famero de candidatos, realiza la calibraci\u00f3n con regresi\u00f3n de cuadro delimitador y emplea supresi\u00f3n no m\u00e1xima (NMS) para fusionar candidatos superpuestos.<\/p>\n<p>Las salidas de R-Net, ya sea que la entrada sea una cara o no, son un vector de 4 elementos que es el cuadro delimitador para la cara y un vector de 10 elementos para la localizaci\u00f3n de puntos de referencia faciales.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-523\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/rnet-1024x446.png\" alt=\"\" width=\"1024\" height=\"446\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/rnet-1024x446.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/rnet-300x131.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/rnet-768x335.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/rnet.png 1188w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 4. Procesamiento de Im\u00e1genes, R-Net<\/p>\n<p>&nbsp;<\/p>\n<ul>\n<li>Etapa 3: La Red de Salida (O-Net)<\/li>\n<\/ul>\n<p>Esta etapa es similar a R-Net, pero esta red de salida tiene como objetivo describir la cara con m\u00e1s detalle y generar las posiciones de los cinco puntos de referencia faciales para los ojos, la nariz y la boca.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-524\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/onet-1024x342.png\" alt=\"\" width=\"1024\" height=\"342\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/onet-1024x342.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/onet-300x100.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/onet-768x257.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/onet.png 1538w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 5. Procesamiento de Im\u00e1genes, O-Net<\/p>\n<p>&nbsp;<\/p>\n<p>Las tres tareas de MTCNN, la tarea de la red es generar tres cosas: clasificaci\u00f3n de rostros\/no rostros, regresi\u00f3n de cuadro delimitador y localizaci\u00f3n de puntos de referencia faciales. 1.- Clasificaci\u00f3n de caras: este es un problema de clasificaci\u00f3n binaria que utiliza p\u00e9rdida de entrop\u00eda<\/p>\n<p>cruzada. 2. Regresi\u00f3n de cuadro delimitador: el objetivo de aprendizaje es un problema de regresi\u00f3n. Para cada ventana candidata, se calcula el desplazamiento entre la candidata y la realidad del terreno m\u00e1s cercana. La p\u00e9rdida euclidiana se emplea para esta tarea. 3. Localizaci\u00f3n de puntos de referencia faciales: la localizaci\u00f3n de puntos de referencia faciales se formula como un problema de regresi\u00f3n, en el que la funci\u00f3n de p\u00e9rdida es la distancia euclidiana. Hay cinco puntos de referencia: ojo izquierdo, ojo derecho, nariz, comisura izquierda de la boca y comisura derecha de la boca.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #0000ff\">B.\u00a0\u00a0 SVM<\/span><\/h3>\n<p>La m\u00e1quina de vectores de soporte (SVM) puede realizar de manera eficiente una clasificaci\u00f3n no lineal, especialmente con un conjunto de datos peque\u00f1o. Las SVM son modelos de aprendizaje supervisado con algoritmos de aprendizaje asociados que analizan los datos utilizados para la clasificaci\u00f3n y el an\u00e1lisis de regresi\u00f3n. Dado un conjunto de ejemplos de entrenamiento, cada uno marcado como perteneciente a una u otra de dos (o m\u00faltiples) categor\u00edas, un algoritmo de entrenamiento SVM construye un modelo que asigna nuevos ejemplos a una categor\u00eda u otra, convirti\u00e9ndolo en un binario lineal no probabil\u00edstico.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-525\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj9svm-1024x654.png\" alt=\"\" width=\"1024\" height=\"654\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj9svm-1024x654.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj9svm-300x192.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj9svm-768x491.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj9svm.png 1080w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 6. Datos originales y transformados usando SVM<\/p>\n<p>&nbsp;<\/p>\n<p>Una SVM construye un hiperplano o un conjunto de hiperplanos en un espacio de dimensi\u00f3n alta o infinita para clasificaci\u00f3n o regresi\u00f3n. Intuitivamente, una buena separaci\u00f3n la logra el hiperplano que tiene la mayor distancia al punto de datos de entrenamiento m\u00e1s cercano de cualquier clase (el llamado margen funcional), ya que en general cuanto mayor es el margen, menor es el error de generalizaci\u00f3n del clasificador. Mientras que el problema original definido en un espacio de dimensi\u00f3n finita puede no ser linealmente separable en ese espacio. Por esta raz\u00f3n, el espacio original de dimensi\u00f3n finita se puede mapear en un espacio de dimensi\u00f3n mucho m\u00e1s alta, lo que presumiblemente facilita la separaci\u00f3n en ese espacio. SVM multiclase tiene como objetivo asignar etiquetas a las instancias mediante el uso de SVM, donde las etiquetas se extraen de un conjunto finito de varios elementos.<\/p>\n<p>El enfoque dominante para hacerlo es reducir el problema multiclase \u00fanico a m\u00faltiples problemas de clasificaci\u00f3n binaria.<\/p>\n<p>En La Figura 6, a. muestra los datos originales, b. datos originales con separador a\u00f1adido, c. muestra los datos transformados, la funci\u00f3n matem\u00e1tica utilizada para la<\/p>\n<p>transformaci\u00f3n se conoce como funci\u00f3n\u00a0kernel.\u00a0 Los tipos de kernel son :Lineal, Polin\u00f3mico, Funci\u00f3n de base radial (RBF), Sigmoide, d. muestra los puntos de datos que est\u00e1n en los m\u00e1rgenes y se conocen como\u00a0vectores de soporte, e. muestra los \u00a0datos que no se pueden separar con hiperplano, f. muestra los \u00a0datos con aumento de dimensionalidad y separados con una superficie de decisi\u00f3n .<\/p>\n<h3><span style=\"color: #0000ff\"><strong>IV. Metodolog\u00eda y Resultados<\/strong><\/span><\/h3>\n<p>Para la creaci\u00f3n de las bases de datos se utilizan fotos de tel\u00e9fonos inteligentes de diferentes marcas y modelos como Iphone XI , Iphone XII Promax, Iphone X, Iphone VIII, Iphone VI de MAC IOS, Samsung J7, Xiaomi, Huawei de usuarios de la App Salug, que junto con la foto enviaron informaci\u00f3n del tel\u00e9fono, del term\u00f3metro y de su temperatura al momento de tomarse la foto para asociar la foto con la categor\u00eda de temperatura . La App Salug creada para la contenci\u00f3n del Coronavirus que obtiene informaci\u00f3n de los s\u00edntomas asociados, y que forma parte de un proyecto de investigaci\u00f3n \u00a0previo donde se concluye que el \u00a0tel\u00e9fono inteligente podr\u00eda constituirse en una herramienta muy \u00fatil para el monitoreo de la salud de una poblaci\u00f3n . Desde la plataforma Instagram de la App Salug, se obtuvieron 200 im\u00e1genes recolectadas y guardadas en la nube en Google Drive, en un carpeta ra\u00edz y clasific\u00e1ndolas \u00a0con la temperatura. para ser utilzadas con un programa en Python de Google Colab.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-526\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj7-1024x540.png\" alt=\"\" width=\"1024\" height=\"540\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj7-1024x540.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj7-300x158.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj7-768x405.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj7.png 1844w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/> <img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-527\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj8-1024x506.png\" alt=\"\" width=\"1024\" height=\"506\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj8-1024x506.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj8-300x148.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj8-768x379.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj8.png 1798w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 7. Obtenci\u00f3n de Im\u00e1genes para Base de Datos<\/p>\n<p>&nbsp;<\/p>\n<p>Las fotos enviadas con sus respectivas temperaturas se clasifican y almacenan en las respectivas carpetas de categor\u00edas de las temperaturas, en este caso nos interesan las categor\u00edas en el rango de 36.5<sup>o <\/sup>C a 37.5<sup>o<\/sup> C.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-528\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj5-1024x422.png\" alt=\"\" width=\"1024\" height=\"422\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj5-1024x422.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj5-300x124.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj5-768x316.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj5.png 1864w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 8. Obtenci\u00f3n de Im\u00e1genes para Base de Datos<\/p>\n<p>La CNN arroja el rostro de la imagen que se obtiene \u00a0y la SVM que entrena con las categor\u00edas de las temperaturas de acuerdo con las im\u00e1genes previamente almacenadas .<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-529\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj4-1024x615.png\" alt=\"\" width=\"1024\" height=\"615\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj4-1024x615.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj4-300x180.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj4-768x461.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/ajj4.png 1652w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Figura 9. Predicci\u00f3n de la temperatura usando MTCNN y SVM<\/p>\n<p>&nbsp;<\/p>\n<p>Se realizan 30 pruebas con 3 categor\u00edas de temperaturas para probar la eficacia y eficiencia de los algoritmos, obteniendo un 100% de eficacia en la detecci\u00f3n del rostro que est\u00e1 a cargo de la CNN MTCNN y hasta el 54% de eficacia de la SVM en la predicci\u00f3n de la temperatura. Los resultados se pueden ver en la Tabla 1.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-520\" src=\"http:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/tabal1jj-1024x381.png\" alt=\"\" width=\"1024\" height=\"381\" srcset=\"https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/tabal1jj-1024x381.png 1024w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/tabal1jj-300x112.png 300w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/tabal1jj-768x286.png 768w, https:\/\/blog.espol.edu.ec\/jjlainez\/files\/2022\/09\/tabal1jj.png 1644w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center\">Tabla 1. Cuadro de resultados de predicciones exitosas<\/p>\n<p><span style=\"color: #0000ff\"><strong>V.\u00a0 Conclusiones<\/strong><\/span><\/p>\n<p>Este estudio permite concluir que usando las im\u00e1genes faciales\u00a0 tomadas con un tel\u00e9fono inteligente, elimina la necesidad de cualquier dispositivo especial como un term\u00f3metro infrarrojo o una c\u00e1mara t\u00e9rmica que son equipos costosos y est\u00e1n instalados a la entrada de lugares de concurrencia masiva como lo son los centro comerciales , aeropuertos o instituciones educativas , siendo este el punto de control, despu\u00e9s de haber recorrido un camino desde la residencia de la persona hasta el sitio de destino, \u00a0incrementando el riesgo de contagiar a otras personas si este individuo tiene la enfermedad. Esta soluci\u00f3n podr\u00eda ser\u00a0 una implementaci\u00f3n econ\u00f3mica y conveniente para monitorear la temperatura, especialmente para enfermedades contagiosas relacionadas con la fiebre, como el COVID-19 de una poblaci\u00f3n de estudiantes o trabajadores de la industria. Con un conjunto de datos a gran escala, se mejorar\u00e1 a\u00fan m\u00e1s la precisi\u00f3n y confiabilidad de la predicci\u00f3n de la temperatura usando un modelo CNN-SVM. Las im\u00e1genes usadas fueron tomadas de tel\u00e9fonos inteligentes de diferentes marcas y modelos . Las im\u00e1genes faciales fueron extra\u00eddas con una CNN y el entrenamiento con un modelo SVM para predecir la temperatura. Los resultados experimentales podr\u00edan mejorar (actualmente las casos est\u00e1n a la baja) con mas datos y son muy alentadores para un nuevo m\u00e9todo para medir y monitorear la temperatura corporal.<\/p>\n<h5>Referencias<\/h5>\n<p>[1] \u00a0Hutchison, James S.; et al., \u201cHypothermia therapy after traumatic brain injury in children\u201d. New England Journal of Medicine. 358 (23): 2447\u20132456 (2008).<\/p>\n<p>[2] \u00a0ImageNet, http:\/\/www.image-net.org.<\/p>\n<p>[3] \u00a0M. H. Yang, D. J. Kriegman, N. Ahuja, \u201cDetecting faces in images: a survey,\u201d IEEE Transactions on Pattern Analysis and Machine Intelligence 24 (1) 34-58 (2002).<\/p>\n<p>[4] \u00a0P. Viola , M. Jones, \u201cRobust real-time object detection,\u201d International Journal of Computer Vision, (2001)<\/p>\n<p>[5] \u00a0Viola, P. and Jones, M., \u201cRapid Object detection using a boosted cascade of simple features.\u201d Proceedings of CVPR, vol. 1 pp. 511\u2013518, (2001).<\/p>\n<p>[6] \u00a0Viola, P. and Jones, M., \u201cRobust Real-time Object Detection,\u201d International Journal of Computer Vision, Vol. 57, Iss. 2, pp. 137\u2013154, (2001).<\/p>\n<p>[7] \u00a0Papageorgiou, C., Oren, M., and Poggio, T., \u201cA general framework for object detection,\u201d Sixth International Conference on Computer Vision, pp. 555-562, (1998).<\/p>\n<p>[8] \u00a0Freund, Y. and Schapire, R., \u201cA decision theoretic generalization of on-line learning and an application to boosting,\u201d Computational Learning Theory: Eurocolt\u201995, pp 23-37, (1995).<\/p>\n<p>[9] \u00a0C. Burges, \u201cA Tutorial on Support Vector Machines for Pattern Recognition,\u201d Data Mining and Knowledge Discovery 2, 121- 167, 1998.<\/p>\n<p>[10] \u00a0Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome, \u201cThe Elements of Statistical Learning: Data Mining, Inference, and Prediction\u201d (Second ed.). New York: Springer. p. 134, (2008).<\/p>\n<p>[11] \u00a0Duan, Kai-Bo; Keerthi, S. Sathiya, \u201cWhich Is the Best Multiclass SVM Method? An Empirical Study\u201d, Multiple Classifier Systems. LNCS. 3541. pp. 278\u2013285, (2005).<\/p>\n<p>[12] \u00a0Krizhevsky, A., Sutskever, I., Hinton, G.E., \u201cImagenet classification with deep convolutional neural networks,\u201d Proceedings of the 25th International Conference on Neural Information Processing Systems - Volume 1, Pages 1097-1105, Lake Tahoe, Nevada, (2012).<\/p>\n<p>[13] \u00a0Russakovsky, O., Deng, J., Su, H., et al., \u201cImageNet Large Scale Visual Recognition Challenge,\u201d International Journal of Computer Vision (IJCV). Vol. 115, Issue 3, pp. 211\u2013252 (2015).<\/p>\n<p>[14] \u00a0Simonyan, K., Zisserman, A., \u201cVery Deep Convolutional Networks for Large-Scale Image Recognition,\u201d arXiv technical report, (2014).<\/p>\n<p>[15] \u00a0University of Oxford, Visual Geometry Group, http:\/\/www.robots.ox.ac.uk\/~vgg\/research\/very_deep\/.<\/p>\n<p>[16] \u00a0He, K., Zhang, X., Ren, S., &amp; Sun, J., \u201cDeep Residual Learning for Image Recognition,\u201d 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770-778, (2016)<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<\/div>\n<\/div><\/div><\/div><\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>Juan Jos\u00e9 La\u00ednez Bola\u00f1os jjlainez@espol.edu.ec Version pdf Resumen\u2014 En este proyecto, proponemos contener el COVID-19 y otras enfermedades\u00a0contagiosas usando una APP obteniendo la temperatura corporal a partir de una foto de una c\u00e1mara\u00a0digital, una c\u00e1mara\u00a0web de un computador o una c\u00e1mara\u00a0de un tel\u00e9fono\u00a0inteligente, siendo como objetivo extraer caracter\u00edsticas faciales con un modelo de red neuronal [&hellip;]<\/p>\n","protected":false},"author":11236,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-506","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/pages\/506","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/users\/11236"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/comments?post=506"}],"version-history":[{"count":37,"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/pages\/506\/revisions"}],"predecessor-version":[{"id":555,"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/pages\/506\/revisions\/555"}],"wp:attachment":[{"href":"https:\/\/blog.espol.edu.ec\/jjlainez\/wp-json\/wp\/v2\/media?parent=506"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}