-->

Reescribiendo el diccionario: un poco de lenguaje e inteligencia artificial

No es habitual promulgarme en eventos de charlas. Hoy os dejo mi última participación en una de ellas, en la pasada Semana de la Ciencia de Donostia. 

En esta ocasión, hablé sobre las consecuencias que puede tener la inteligencia artificial en nuestra visión de las cosas, y de un poco de seguridad informática. Espero que os guste. Tenéis todas las charlas que se impartieron junto a la mía aquí. Cada una de ellas dura unos 10 minutos y tienen una buena dosis de humor.


ZIENTZIA CLUB en Donostia:Julián Estévez Donosti from UPV/EHU on Vimeo.



Qué vas a oír cada vez más sobre Inteligencia Artificial

Aprendizaje por refuerzo (Reinforcement Learning, en la lengua del imperio). Es mi opinión. Pero voy a explicar las razones.

La Inteligencia Artificial la podemos imaginar como un agente que puede terminar ganándonos al ajedrez. Sin embargo, en el caso de Deep Blue (1997), hubo que enseñarle a jugar primero. No era una máquina que partía de 0, sino que tenía almacenadas millones de grandes partidas en su memoria, y a cada movimiento se dedicaba a analizar la mejor opción.

Totalmente distinto es el caso de AlphaGo (2016), la IA de Google que derrotó al campeón del mundo de Go. En este caso, la máquina adquirió el conocimiento por sí misma, jugando ella sola millones de partidas, y comprobando cómo de bueno era cada movimiento. Consiste en una especie de prueba y error. Gracias al poder computacional actual, se pueden hacer muchas miles de pruebas.

Es decir, a AlphaGo no hubo que enseñarle o introducirle un conocimiento previo, sino que es como si a nosotros nos hubieran dado un tablero con las fichas, y lo aprendiéramos a jugar como un maestro nosotros mismos, sin leer ni un solo libro ni ver ninguna partida previa. Mi único conocimiento previo son las instrucciones del juego.



Menos mediático, pero el aprendizaje por refuerzo ya fue noticia en 2015, donde un programa de ordenador aprendió a ganar en 49 juegos distintos del clásico Atari 2600, simplemente haciendo movimientos y viendo qué puntuación obtenía (se publicó en Nature).

En cierto sentido, el aprendizaje humano también sigue el proceso de reinforcement learning, sobre todo en el dominio de habilidades motoras. Imaginémonos cómo aprendimos a andar en bici, o a nadar, o a andar. ¿Cómo nada un buen deportista? Ejecuta los mejores movimientos en el momento preciso que él ha visto que le impulsan con más fuerza o velocidad a través del agua. Es lo mismo que un niño pequeño cuando aprende a andar en bici. Tras un proceso, hay una convergencia en la que el niño aprende a emplear la fuerza justa en cada pierna y espalda para mantenerse en equilibrio.

En el siguiente vídeo, un sencillo robot aprende cuál es la técnica (posición y fuerza) con la que se desplaza más rápido por una alfombra.


En ingeniería, a la consciencia de que un tipo de movimiento lleva a un a buen resultado, se le denomina recompensa.

El aprendizaje por refuerzo no es cosa de ahora. Sin embargo, la combinación de este algoritmo y otras técnicas de inteligencia artificial, como redes neuronales, o árboles de decisión, se está mostrando muy prometedor de cara a que cada vez las máquinas aprendan tareas más complejas y menos limitadas. No nos engañemos, jugar al Go es bastante limitado, tanto como avanzar en línea recta. Es por ello que cada vez se oirá más el término deep reinforcement learning, que nace de sumar deep learning + reinforcement learning. Deep learning lo han hecho muy famoso los gigantes tecnológicos, y su principal característica es la existencia de muchas capas de redes neuronales. No solo eso, una de las compañías que se ha convertido en referencia últimamente es DeepMind, de Google.

De hecho, precisamente es esta capacidad de aprendizaje automático lo que preocupa a los científicos. Hay incertidumbre sobre si una máquina, gracias a algoritmos como el deep reinforcement learning, pueda llegar aprender cosas para los que los humanos no las hemos creado. Es decir, que amplíe descontroladamente el aprendizaje gracias a la mejora de percepción que está sufriendo esta tecnología.


Qué ocurre cuando le das un péndulo a una máquina

Hoy os dejo la charla que tue el honor de dar en la sesión de Naukas Bilbao 2016, y de paso agradecer a la organización y al público el apoyo y facilidades que nos dan a los ponentes. 

Mi charla se titulaba ¿Qué ocurre cuando le das un péndulo a una máquina? e intenté tocar muy superficialmente las implicaciones sociales y legales que puede tener la entrada masiva de robots en nuestras vidas. Aquí os dejo el link y la charla.




Y recordad que esta semana, Naukas sigue "de gira",  y hace escala en Donostia, donde participará en el Passion For Knowledge que organiza el Donostia International Physics Center y que reúne a varios premios Nobel y grandes científicos en varias charlas.

Aquí os dejo el programa.


La Inteligencia Artificial y el Infome de los Cien Años

Algunas de las mayores empresas tecnológicas del mundo (Amazon, Facebook, Amazon, IBM y Alphabet) están intentando predecir y ponerse de acuerdo en el futuro de la Inteligencia Artificial (IA). Concretamente, sus reflexiones quedaron reflejadas en el Informe de los Cien Años para el período de 2015 (es un proyecto comenzado en octubre de 2014) que auspicia la universidad de Stanford, y en el que intervienen esos gigantes empresariales. 

En él, se analiza la penetración de la Inteligencia Artificial (IA) en la sociedad, ciencia y en la tecnología.y se realizan una serie de reflexiones y recomendaciones sobre la regulación y las políticas públicas a llevar a cabo en la IA de cara a 2030. El seguimiento de estas sugerencias en teoría permitiría avanzar en otros campos en los que la IA influye, y que se implemente de una manera justa, ética y moral. En este estudio no sólo participan expertos en tecnología, sino también en derecho, economía o política. El Gobierno de EEUU ya solicitó formalmente en junio de este año información sobre las implicaciones de la tecnología inteligente.

En este post mencionaré los puntos que más me han llamado la atención del informe, a modo de resumen. El informe completo podéis descargarlo de esta página.


INTRODUCCIÓN
- La primera frase del informe (p. 6) es que las predicciones apocalípticas de las películas y novelas sobre la IA son ficticias. Actualmente, esta ciencia ya tiene su influencia y está mejorando nuestras vidas en términos de productividad, sanidad y seguridad.

Conviene poner el foco en el abuso de la IA. Algunos de los campos más prometedores que mejorará próximamente son el transporte seguro, la educación infantil y en la autosuficiencia de las personas.

Una de las claves del éxito consistirá en la personalización de las máquinas a cada persona, lo cual se logrará cuando se distribuyan aún más.


POLÍTICA Y REGULACIÓN
- La robótica y la IA ya está sustituyendo a los humanos en los puestos de trabajo. Por lo tanto, la sociedad está en un momento crucial para que esta sustitución y transición nos lleve a una calidad de vida mejor, una sociedad más democrática, igualitaria y transparente (p. 6).

- Uno de los factores que más impulsa la IA es la disponibilidad de bases de datos masivas, lo cual a su vez también plantea el eterno problema de la escalabilidad de la IA (p. 8).

- Las políticas públicas deben estar dirigidas a facilitar la adaptación de la IA en la sociedad, fortalecer sus beneficios y mitigar los inevitables errores. Debería promocionarse el debate sobre cómo va a extenderse esta disciplina en la sociedad, en términos de privacidad y beneficios equitativos (p. 10).


- Actualmente en Estados Unidos hay 16 agencias gobiernan sectores de la economía y están relacionadas con la IA. Algunos de los conceptos a aclarar cuanto antes son: "¿quién es responsable en un accidente de coche autónomo o cuando falla un dispositivo médico inteligente?" "¿Cómo puede la IA ayudar a prevenir el fraude fiscal o la discriminación racial? "¿Cómo se protegen las habilidades de los empleados que claramente pueden ser reemplazados por máquinas?" (p.10)


DEFINICIÓN DE IA
La IA es la actividad dedicada a hacer las máquinas inteligentes, y la inteligencia es la capacidad que permite a un agente funcionar de acuerdo a su entorno y a su posible evolución (p. 12)


TENDENCIAS DE LA IA en INVESTIGACIÓN
Esta parte del informe es bastante extensa (p. 13 a 42), en la que el informe estudia dos aspectos:

- en primer lugar, define brevemente las distintas ramas y técnicas de la IA que principalmente seguiremos desarrollando (deep learning, navegación robótica, aprendizaje por refuerzo, etc). A mí particularmente me ha llamado la atención la afirmación de que el problema de la navegación robótica se considera "ya resuelto", y que la investigación tiene que dirigirse hacia la interacción con el entorno y la percepción automática.

- en segundo lugar, predice cómo afectará la inteligencia a distintos sectores de nuestra sociedad, tales como educación, sanidad, transporte o seguridad. No voy a entrar en detalles al respecto, ya que quiero centrar el post en las implicaciones y necesidad de regulación. Si queréis un buen libro que explica muy bien estos retos y previsiones en distintos sectores de la economía, os recomiendo el libro El Auge de los Robots.


RECOMENDACIONES FINALES PARA LA REGULACIÓN DE LA IA

 - Definir un plan para que expertos de distintos campos asesoren a los gobiernos de distintos niveles en la aplicación de la IA en la sociedad, y los beneficios que puede conllevar.

- Eliminar las barreras e impedimentos actuales para investigar la equidad, seguridad, privacidad e impacto social de los sistemas inteligentes.

- Aumentar el gasto público y privado en los estudios interdisciplinarios de los impactos sociales de la IA.



Estas conclusiones coinciden mucho con las que el Instituto de Investigación de Aprendizaje Máquina de EEUU redactó en julio, y se puede leer también aquí




Fuente

Naukas Bilbao 2016, la cita con la divulgación científica

Con el fin del verano, vuelve como un año más la gran cita de píldoras científicas: Naukas Bilbao. Este año se celebrará el 16 y 17 de septiembre, así que id haciendo hueco en vuestras agendas. El programa provisional de charlas podéis encontrarlo aquí:


Para quien no haya oído hablar de este evento, dos ideas: consiste en que los divulgadores de ciencia (principalmente participantes en la plataforma Naukas) subimos al escenario a contar ideas científicas, pero en no más de 10 minutos. Las charlas son de los temas más variados que os podáis hacer a la idea: biología, física, ingeniería, matemáticas, química, astronomía, etc.

Este año además, contaremos con la participación de Pedro Duque, el astronauta español, durante el viernes por la mañana. Además, también se realizarán sesiones de Naukas Kids para los más peques, junto a talleres y otras actividades que la organización irá desgranando en la cuenta @Naukas_com.

A un servidor le toca sus 10 minutos de gloria el viernes por la tarde: ¿Qué pasa cuando le das un péndulo a una máquina?

Habrá streaming del evento. ¡Estáis todos invitados!

¿Se puede predecir el tiempo del ganador de 100m lisos en las Olimpiadas de Río?

Ya hay varios casas de apuesta en Internet que hacen sus pronósticos sobre quién será el ganador de los 100m. A día de hoy, por ejemplo en http://www.paddypower.com,




Y en un gráfico quedaría así:

En este punto, lo que tenemos es una serie de datos. Ahora, de lo que se trata es de intentar predecir el tiempo del Oro en la final de 2016. Tenemos una serie de datos temporales, y queremos predecir el nuevo punto. Para ello, hay una información muy valiosa, y es que la tendencia de los tiempos es claramente bajista.

La primera opción consistiría en obtener una línea que capture el comportamiento de los números de la manera más fiel posible. A esto se le llama línea de regresión, y se puede hacer con el método de mínimos cuadrados.



Lo cual corresponde a una recta de la siguiente forma:
En la ecuación anterior, x representa al año e y al tiempo. Por lo tanto, si hacemos cálculos, el tiempo en x=2016 sería de y=9,64s.

El método de los mínimos cuadrados persigue que en todos los puntos, la diferencia cuadrática entre el punto real y la recta que se obtenga sea la mínima posible. Sin embargo, esto lo hemos encontrado solo para una ecuación de segundo orden. En principio, cuanto mayor sea el grado de x, más se puede aproximar la curva a los puntos reales de los tiempos. Probemos y veamos en la siguiente imagen:


La línea roja corresponde al polinomio de segundo orden y el verde, al de orden 3. Sus ecuaciones son las siguientes:



Lo cual, para el caso rojo nos da un tiempo de 9,82 segundos en 2016. Y para el verde, 9,19 segundos. No conviene seguir aumentando el orden de la ecuación sin ninguna razón, ya que puede ocurrir el problema de overfit, y que los grados altos empiecen a asemejarse a la curva mucho peor que las ecuaciones de bajo grado.

Resumiendo, tenemos las siguientes opciones:
a) 9,64 seg
b) 9,82 seg
c) 9,19 seg.

¿Con cuál nos quedamos? Pues no necesariamente con ninguno. Me explico: Fijémonos en la primera ecuación, la de primer grado. 

 
Como se puede ver, casi ningún punto coincide con la recta, sino que hay una distancia entre la recta que hemos creado y el punto real. A esto se le llama residuo, y los hay de diferente magnitud a lo largo de todos los años, e incluso varían a estar por encima y debajo de la curva. Por estos residuos, quizás convenga no tratar la predicción de datos de manera determinista, sino considerando que va a haber una incertidumbre en nuestros pronósticos. Es decir, empleando métodos probabilísticos. Y uno de los más interesantes, es el método de Bayes.

Es una simplificación extrema, pero Bayes realiza predicciones según va a haciendo observaciones. De hecho, para realizar la predicción voy a emplear una variante de Bayes: el filtro de Kalman (explicada justo en la entrada anterior), el cual tiene una propiedad de predicción. Su implementación para una dimensión es muy sencilla, y este filtro va adaptándose con los nuevos valores. Sin entrar en muchas explicaciones y siguiendo los pasos del enlace anterior, el tiempo que arroja el filtro de Kalman es de 9,37 segundos.

A modo de resumen de la entrada: se aprecia que hay muchas maneras y basándose en distintos enfoques para realizar predicciones en el tiempo. Todo esto es la base de una disciplina muy en boga: machine learning, o el aprendizaje máquina, el cual sobre todo os sonará por el big data y la inteligencia artificial. 

No hemos ahondado en las muchas maneras más complejas que las presentadas para hacer predicciones, y sería pura casualidad que alguno de los resultados aquí arrojados coincidiera con el Oro Olímpico. Pero tampoco nos hemos metido en pasos previos que sí que se dan en el machine learning: descarte de valores poco representativos, filtrado, comprobación del ajuste de los métodos de predicción, etc.

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best Web Hosting