Estudio sobre técnicas de análisis de encefalogramas

Transcription

Estudio sobre técnicas de análisis de encefalogramas
Estudio sobre técnicas de análisis de encefalogramas basados en
redes neuronales.
Gema Morales Gavilán
[email protected]
Resumen.
En este trabajo se llevará a cabo una
investigación sobre cómo se utilizan las
redes neuronales para el análisis de
electroencefalogramas (EEG) y qué
resultados se pueden obtener, a modo de
estudio teórico para una posible
investigación práctica posterior.
Palabras clave.
Electroencefalograma, EEG, redes
neuronales.
1. Introducción.
Las redes neuronales artificiales (en
adelante redes neuronales) son una
tecnología cuyo primer modelo
matemático se presentó en 1943 por
Warren McCulloch y Walter Pitts [6].
No obstante ha sido recientemente
cuando el modelo de cómputo
tradicional se ha mostrado ineficaz
frente a los nuevos retos aparecidos con
la era digital, como es el caso del
procesamiento de imágenes, y el amplio
abanico de posibilidades que esto
conlleva, lo que ha contribuido al
desarrollo de técnicas como las redes
neuronales. Este trabajo se centrará en
la utilización de redes neuronales para
procesar
las
señales
de
un
encefalograma. El objetivo es estudiar
qué técnicas se emplean y valorar qué
resultados pueden obtenerse.
En primer lugar se describirán los
principios
y
características
del
electroencefalograma, para comprender
de qué tipo de señales se trata y porqué
las redes neuronales son una buena
opción para su análisis.
Ignacio Prieto Egido
[email protected]
A continuación se analizarán
algunos estudios concretos en los que se
emplean redes neuronales para procesar
la información del electroencefalograma
y obtener una respuesta para un
problema planteado, centrándonos en
las técnicas y algoritmos que se utilizan.
2. Electroencefalograma (EEG).
Un electroencefalograma (EEG),
según se define en [8], “es el registro de
las variaciones de potencial eléctrico
entre dos electrodos (registro bipolar) o
entre un electrodo y otro indiferente
(registro monopolar) situados en el
cuero cabelludo”. Cada pareja de
electrodos se denomina canales, y su
disposición sobre el cráneo se conoce
como montaje. Para que las medidas
realizadas sean
generalizables y
repetibles el montaje suele seguir las
especificaciones del sistema “10-20”,
que define disposiciones de electrodos
en función de la aplicación que se
quiere dar al EEG.
Colocación de sensores para un EGP
La actividad registrada en el EEG es
una medida atenuada de los flujos de
1
corriente generada sobre todo por las
neuronas de las capas más superficiales
de la corteza, mientras que áreas más
profundas como el hipocampo o el
tálamo no contribuyen de forma directa
debido a la fuerte atenuación que sufren
las señales que generan. Las capas de
tejido y de hueso situadas entre el
electrodo y la fuente eléctrica
(neuronas) se pueden modelar mediante
condensadores y resistencias que actúan
como filtros y atenuadores. Debido a
esto la amplitud del potencial eléctrico
detectado es del orden de microvoltios,
mientras que la señal generada por una
neurona tiene una amplitud de
milivoltios.
El EEG se realiza con una
resolución temporal baja, de unos
cientos de milisegundos a segundos [6].
Las señales del EEG se caracterizan
por tener una frecuencia entre 1 y 30 Hz
y una amplitud comprendida entre los
20 a los 100 μV. Estas señales se han
clasificado en cuatro tipos en función
del la zona del espectro que ocupan.
•
Las ondas alpha comprendidas
entre los 8 a los 13 Hz, tienen una
amplitud moderada y están
asociadas a la vigilia relajada,
detectándose mejor en las zonas
parietales y occipitales.
•
El segundo grupo son las ondas
beta, que poseen una amplitud
menor y se distribuyen entre los
13 y los 30 Hz. La aparición de las
ondas beta se relaciona con
estados de actividad mental
intensa y son más acusadas en las
zonas frontales.
•
Las ondas delta son las que tienen
mayor amplitud, se encuentran
entre los 0.5 y los 4 Hz.
•
las theta están entre los 4 y 7 Hz.
Estas dos últimas son típicas de estados
de somnolencia y la fase precoz del
sueño, pero si se encuentran durante la
vigilia suelen ser un signo de disfunción
cerebral.
El EEG es una prueba muy útil por
ser no invasiva y por servir para
identificar
trastornos
convulsivos,
anomalías del sueño y algunos
trastornos metabólicos o estructurales
del cerebro, y su análisis puede
considerarse como un problema de
clasificación.
3. Aplicación de redes
neuronales al análisis de EEG.
El proceso de generación de señales
eléctricas por parte de las neuronas
todavía no ha sido comprendido
completamente. Las señales EEG se
caracterizan por no ser estacionarias e
incluso podrían ser no lineales [3], por
lo que analizar estas señales con
modelos no lineales puede aportar
información de interés. A todo esto se
suma que un EEG se compone de
múltiples señales (correspondientes a
los respectivos canales), por lo que
antes de utilizar un esquema de red
neuronal se necesita un procesado
previo de la señal para extraer sus
características más relevantes [10].
3.1 Preprocesado.
Existen dos tipos generales de
preprocesado, aquellos realizados en el
dominio del tiempo y los realizados en
el dominio de la frecuencia [10].
-
En el dominio de la frecuencia se
puede combinar el cálculo de la
FFT con un enventanado, o llevar
a cabo un promediado de la
2
respuesta espectral en distintos
intervalos de tiempo.
-
Una técnica muy usada en el
dominio del tiempo es tratar de
ajustar los datos a un modelo
lineal,
como
un
modelo
autorregresivo (AR).
3.1.1 Modelo de parámetros AR.
En los estudios llevados a cabo en
[10], se concluye que el uso de los
coeficientes AR del EEG es más
adecuado que el de los coeficientes de
Fourier, la FFT, la estimación del
espectro
mediante
un
modelo
autorregresivo o el análisis mediante
series temporales. Una explicación para
este comportamiento es que un modelo
basado en coeficientes AR sólo necesita
8 parámetros, mientras que las series
temporales pueden necesitan 128
muestras. Un mayor número de
parámetros de entrada requiere una red
más grande que es más difícil de
entrenar, y por eso los resultados
obtenidos con el primer método serán
más precisos. Por su parte las técnicas
de Fourier asumen que la señal es
estacionaria, y aunque se pueden
adaptar a modelos no estacionarios y no
lineales, también requieren muchos más
parámetros que un modelo de
coeficientes AR.
El número de coeficientes AR
empleado en [10] y [3] es 8, lo que
equivale a considerar que la señal bajo
análisis
tiene
4
componentes
frecuenciales. Esto se justifica porque el
diagnóstico a partir del EEG se basa en
clasificar la señal en función de 4 zonas
del espectro, como hemos visto
previamente.
Otra posibilidad empleada en [4] y
[1] es aplicar una transformación
discreta
Wavelet
(DWT).
Esta
transformación se basa en dividir una
señal en sus diferentes componentes
frecuenciales
y
estudiar
cada
componente con una resolución acorde
a su escala, y se comporta mejor que la
transformada de Fourier ante señales no
estacionarias, ya que se localiza en
ambos dominios, el de la frecuencia y el
del tiempo [13].
Las señales EEG están formadas por
la superposición de distintas estructuras
a frecuencias diferentes y que tienen
lugar en momentos distintos. Uno de los
objetivos del la DWT es el de separar y
clasificar
estas
estructuras,
aprovechando sus buenas prestaciones
de localización en tiempo y frecuencia
al contar con tamaños de ventana
variables (amplio en frecuencias bajas y
estrecho en las altas), logrando
resultados óptimos en todo el rango de
frecuencia.
La selección de la longitud de onda
apropiada y el número de niveles de
descomposición es muy importante en
el análisis. El número de niveles se elige
en función de los componentes de
frecuencia dominantes de la señal, de
forma que las partes de la señal que
tienen una buena correlación con las
frecuencias de clasificación son
conservadas en los coeficientes de la
DWT. En el estudio citado [4], el
número de niveles de descomposición
fue escogido para ser 4. De este modo,
los
coeficientes
de
la
DWT
proporcionan
una
representación
compacta que muestra la distribución de
energía de la señal en tiempo y
frecuencia.
3.1.3 Modelo bilinear.
3.1.2 Transformación Wavelet.
3
Aunque no está demostrado que las
señales EEG sean no lineales, en el
estudio realizado en [3] se intenta
caracterizar estas señales mediante un
modelo no lineal, como paso previo a la
utilización de un clasificador. La
elección de este modelo se justifica por
ser computacionalmente sencillo (es
posible
desarrollar
expresiones
analíticas para su covarianza, su
espectro…), y por ser capaz de
aproximar cualquier sistema no lineal
de segundo orden (un sistema lineal
correspondería a una aproximación de
primer orden, luego el modelo bilinear
podría considerarse como el siguiente
paso).
3.2 Clasificación de los datos
empleando una red neuronal.
Una vez caracterizada la señal se
pasa a aplicar una arquitectura de red
neuronal. En los casos estudiados se
empleó un esquema de perceptrón
multicapas (MLP) o un modelo
conocido como mixture of experts
(ME).
3.2.1 Arquitectura MPL.
En la arquitectura MLP los datos
viajan en una sola dirección, por lo que
también es conocida como red
feedforward. Su estructura se basa en
capas de nodos (neuronas) conectadas;
una capa de entrada y otra de salida,
conectadas por una o más capas ocultas
[11], tal y como se muestra en la figura
1. La función de activación, que
determina cuándo una neurona está
activa, es no lineal. El aprendizaje se
realiza mediante la variación de los
pesos (wij) que regulan las conexiones.
El algoritmo típico para entrenar esta
red es el de back-propagation, que es un
algoritmo supervisado.
Figura 1: esquema de la arquitectura MLP
Esta arquitectura se emplea en los
estudios realizados en [3] para clasificar
las señales EEG de pacientes con
esquizofrenia (SCH), pacientes con
desorden obsesivo compulsivo (OCD) y
sujetos normales (N). En las tablas I y II
se muestran las matrices de confusión
de ambos experimentos obtenidas de
[3]. En ellas se puede observar que la
clasificación
considerando
conjuntamente
los
coeficientes
bilineares y los AR obtiene mejores
resultados que la que usa sólo
coeficientes AR.
TABLA I
Matriz de confusión de la clasificación
basada en parámetros AR.
N
SCH
N
9/15 2/15
SCH 2/21 15/21
OCD 0/11 2/11
OCD
2/15
2/21
3/11
Unknown
2/15
2/21
6/11
TABLA II
Matriz de confusión de la clasificación
basada en parámetros AR y coeficientes
bilineares.
N
SCH OCD
N
10/15 1/15 1/15
SCH 1/21 17/21 1/21
OCD 1/11 2/11 5/11
Unknown
3/15
2/21
3/11
4
En el estudio realizado en [1] se
trató de implementar un clasificador
capaz de diagnosticar la epilepsia. Para
ello se llevó a cabo un preprocesado
mediante una transformada Wavelet
para obtener las 4 componentes
fundamentales del EEG. A partir de la
señal transformada se entrenó una red
MLP de 3 capas.
TABLA III
Resultados obtenidos para un clasificador
de señales sanas y epilépticas con un MLP y una
transformación Wavet.
Señal
Diagnóstico
Test 1
Test 2
Test 3
Test 4
Test 5
Test 6
Epiléptico
Sano
Sano
Sano
Sano
Patológico
Porcentaje
de acierto
97
95
98
97
95
93
3.2.2 Arquitectura ME.
Uno de los principios en que se
basan las redes neuronales es la máxima
“divide y vencerás” que se aplica a
problemas complejos dividiéndolos en
problemas más simples para después
combinarlos y obtener una solución
final. Esta filosofía es la que rige el
funcionamiento de un modelo de redes
neuronales conocido como mixture of
experts (ME) [9], cuyo esquema se
muestra en la figura 2. Esta arquitectura
está compuesta por diferentes módulos:
redes expertas que compiten por
aprender diferentes aspectos de un
problema y un administrador (gating)
que supervisa la competencia y aprende
a asignar diferentes regiones de datos a
diferentes expertos locales. La regla de
aprendizaje
combina
aspectos
competitivos y asociativos, y está
diseñada para favorecer la competencia
entre expertos locales, permitiendo
dividir el espacio de datos en
subregiones manejadas en lo posible por
un único experto local.
Figura 2: esquema de la arquitectura ME.
Cada experto local genera un vector
de salida por cada vector de entrada.
Dichas
salidas
son
combinadas
simultáneamente por el administrador,
quien además usa dichos valores para el
cálculo de pesos en el espacio de
entrada; de forma que la salida final del
ME es una suma ponderada de todos los
vectores de salida.
La arquitectura ME es un concepto
potente que puede ser llevado a una
amplia variedad de aplicaciones
incluyendo el apoyo en decisión de
diagnósticos médicos, debido a
numerosas ventajas como:
- Un modelo complejo global puede
ser descompuesto en un conjunto de
modelos simples locales, en el cual
el diseño del controlador sea
sencillo. Cada modelo puede
representar una fuente de datos
diferente con un estado de
estimación/predicción asociado. En
este caso el sistema ME puede ser
visto como un algoritmo de fusión
de datos.
- Los modelos locales funcionan por
separado,
pero
proporcionan
información a la salida que puede
estar fuertemente correlada, de
modo que el funcionamiento del
sistema total puede ser mejorado en
términos de fiabilidad o tolerancia a
fallos.
5
- La salida global del sistema ME se
deriva de una combinación de las
salidas de los expertos, en donde la
predicción del sistema total es
generalmente superior a cualquiera
de las predicciones de los expertos
individuales.
De esta forma aparecen tres tipos
de segmentos a analizar: segmentos
sanos (seg1), segmentos de la zona
afectada por la enfermedad sin ataque
epiléptico (seg2), y segmentos de la
zona epiléptica durante una crisis
(seg3).
Un inconveniente del modelo
aparece ante la presencia de datos
atípicos, ya que el algoritmo es sensible
a estas desviaciones, obteniendo un bajo
rendimiento.
Las tasas de acierto alcanzadas por
la estructura ME fueron más altas que el
de un MLP independiente entrenado
con el algoritmo de backpropagation.
Una explicación para estos resultados es
que el algoritmo de backpropagation
busca una solución global óptima, por
lo que requiere más iteraciones para
converger. En cambio el algoritmo ME
divide el problema en problemas más
sencillos y combina cada solución.
Además el algoritmo EM de
entrenamiento resulta adecuado para la
estructura modular y consigue una
convergencia más rápida que el de
backpropagation.
Para ilustrar un ejemplo de la
aplicación de redes ME con algoritmo
EM en la clasificación de señales
electroencefalográficas,
se
han
analizado los estudios desarrollados por
Inan Güler, Elif Derya Übeyli y Nihal
Fatma Güler [4].
En
este
análisis,
tanto
el
administrador como las redes expertas
eran redes neuronales perceptrón
multicapa (MLP). Esta configuración es
elegida por las ventajas que ofrece:
capacidad para aprender y generalizar,
pocas exigencias de entrenamiento,
rápida actuación, y facilidad de
implementación.
Para entrenar la red se escogió el
algoritmo conocido como ExpectationMaximization (EM), que sirve para
estimar
los
parámetros
que
proporcionan la máxima verosimilitud.
Es un algoritmo supervisado.
Las señales ECG empleadas en el
estudio procedían de dos conjuntos de
personas: sujetos sanos y pacientes
epilépticos; de estos últimos, se
realizaron medidas en diferentes
momentos (en periodos de no
producirse ataques epilépticos, y en los
momentos en que se produce dicho
ataque).
Para evaluar el comportamiento
de la arquitectura ME, en [4] calculan
una serie de parámetros estadísticos que
se presentan a continuación:
-
-
Especificidad:
numero
de
segmentos sanos clasificados
correctamente sobre el número
total de segmentos sanos.
Sensibilidad en los segmentos de
la zona epiléptica en ausencia de
crisis.
Sensibilidad en los segmentos de
la zona epiléptica durante una
crisis.
Aciertos totales: numero de
segmentos
clasificados
correctamente sobre el número
total de segmentos.
Dichos parámetros se muestran en la
tabla IV obtenida de [4].
TABLA IV
Valores de los parámetros estadísticos con una
arquitectura ME.
6
PARÁMETRO
Especificidad
Sensibilidad (en
ausencia de
crisis)
Sensibilidad
(durante una
crisis)
Total de aciertos
PORCENTAJE
94 %
92.5 %
93 %
93.17 %
4. Conclusiones.
En este trabajo se realizado un
estudio sobe el empleo de redes
neuronales para el análisis de
encefalogramas. Aunque la intención
inicial era realizar un análisis práctico,
la dificultad para encontrar señales de
EEG junto con la complejidad de las
mismas han obligado a realizar un
estudio previo de las técnicas empleadas
para analizar dichas señales. Dentro de
estas técnicas hay que destacar la
importancia de realizar un procesado
previo de la señal para obtener sus
características fundamentales, ya que el
tamaño de las señales de EEG hace
imposible procesarlas directamente.
Además es importante tener en cuenta la
no-estacionariedad y no linealidad de la
señal para seleccionar una herramienta
de preprocesado adecuada, como la
transformada
Wavelet
o
la
aproximación bilinear.
Tras el preprocesado se puede
aplicar una arquitectura de red neural al
análisis de la señal caracterizada. Las
redes neuronales son una técnica sobre
la que actualmente se están realizando
numerosos estudios y que se presenta
como una herramienta de tratamiento de
señales muy interesante debido a su
potencia y su versatilidad. Durante la
búsqueda de información relacionada
con redes neuronales se ha observado
que se pueden utilizar en un gran
abanico de disciplinas y que son muy
adecuadas para resolver problemas
difíciles de modelar mediante los
algoritmos de procesado secuencial
tradicionales. Pero a la vez este tipo de
redes plantean la necesidad de grupos
de trabajo multidisciplinar, ya que su
diseño requiere conocimientos de teoría
de la señal, grafos, estadística,
electrónica
en
el
caso
de
implementaciones
hardware,
programación…
junto
con
los
conocimientos relacionados con el
ámbito a estudiar, como la medicina y la
biología en los ejemplos expuestos.
También se ha analizado la
importancia de la arquitectura de red
neuronal que se escoja en función de
posibles divisiones del problema en
problemas más sencillos. Junto con la
arquitectura de red hay que seleccionar
también el algoritmo de aprendizaje
más adecuado en función de la
estructura de la red.
Entre las aplicaciones prácticas de la
utilización de redes neuronales al
analizar EEG, se pueden destacar las
relacionadas con el ámbito de las
personas con discapacidad y de las
personas mayores, donde las redes
neuronales
pueden
ayudar
a
implementar interfaces hombre/máquina
que funcionen a partir de las señales de
unos electrodos conectados al cuero
cabelludo, como se plantea en [2]. Esto
podría dotar de mayor autonomía a
muchas personas que mantienen las
capacidades cognitivas intactas pero que
son incapaces de controlar su cuerpo,
como las personas que han sufrido
daños en su médula. Además también
constituyen una herramienta muy útil de
diagnóstico, que puede colaborar en la
detección de enfermedades neuronales
como el alzheimer o la epilepsia.
Observando los resultados obtenidos
hasta el momento se concluye que la
utilización de redes neuronales para
analizar
electroencefalogramas
7
constituye una herramienta muy útil con
buenas perspectivas de futuro.
[6]
KANDEL, E. R.; SCHWARTZ, J. H.
y JESSELL, T. M.: Principios de
Neurociencia. Madrid: Mc Graw
Hill, 2001.
[7]
LI YONG; ZHANG SHENGXUN:
Apply Wavelet Transform to analyse
EEG signal.Engineering in Medicine
and Biology Society, 1996. Bridging
Disciplines for Biomedicine.
Proceedings of the 18th Annual
International Conference of the IEEE
Volume 3, 31 Oct.-3 Nov. 1996
Page(s):1007 - 1008 vol.3
[8]
MORA, F. y SANGUINETTI, A. M.:
Diccionario de Neurociencia.
Madrid: Alianza Editorial, 2004.
[9]
Morcego S., Bernardo Estudio de
redes neuronales modulares para el
modelado de sistemas dinámicos no
lineales. M. Gabriela CEMBRANO
GENNARI, J. M. FUERTES (DIR).
Tesis doctoral. Universidad
Politécnica de Cataluña, 2000.
5. Bibliografía.
[1]
[2]
[3]
AKIN, M., ARSERIM; M.A.,
KIYMIK; M.K.; TURKOGLU, I.: A
new approach for diagnosing
epilepsy by using wavelet transform
and neural networks. 2001
PROCEEDING OF THE 23RD
ANNUAL EMBS
INTERNATIONAL CONFERENCE,
OCTOBER 25-28, ISTANBUL,
TURKEY.
FUKUDA, Osamu; TSUJI , Toshio
and KANEKO, Makoto: Pattern
Classification of EEG Signals Using
a Log-linearized. IEEE.
HAZARIKA, Neep; TSOI, Ah Chung
y SERGEJEW, Alex A.: Nonlinear
Considerations in EEG Signal
Classification. IEEE Transactions on
signal processing, vol. 45, no. 4,
April 1997.
[4]
INAN GÜLER; ELIF DERYA
ÜBEYLI ; NIHAL FATMA GÜLER:
A Mixture Of Experts Network
Structure For EEG Signals
Classification. Proceedings of the
2005 IEEE Engineering in medicine
and biology 27th annual conference
Shanghai, China, September 1-4,
2005
[5]
ISASI, Pedro.; GALVÁN, Inés M.:
Redes Neuronales Artificiales: un
enfoque práctico. Madrid: Prentice
Hall, 2004.
[10] TSOI, A. C.; SO, D. S.; SERGEJEW,
A.: Classification of
electroencephalogram using
Artificial neural networks.
ADVANCES IN NEURAL
INFORMATION PROCESSING
SYSTEMS 6, J. D. COWAN, G.
TESAURO, AND J. ALSPECTOR,
ED. SAN FRANCISCO, CA:
MORGAN KAUFMANN, PP. 11511158, 1994.
[11] WIKIPEDIA. Multilayer
perceptron.<http://en.wikipedia.org/
wiki/Multilayer_perceptron>
8