martes, 27 de noviembre de 2018

Dark Data, el lado oscuro del Big Data

Igual que los astrofísicos postulan la existencia en el universo de una materia y energía oscuras no detectables, pero que pueden constituir el 95% de todo lo que existe, la mayor parte de la información que circula por las redes queda fuera del rango de estudio de las empresas. Es lo que se conoce como Dark Data o Datos Oscuros, para algunos una fuente de riqueza potencial y para otros un motivo de riesgo.

La consultora Gartner define el Dark Data como aquellos activos de información que una organización recoge, procesa y almacena durante sus actividades de negocio, pero que no llega a poner en valor ni explotar. De acuerdo con International Data Corporation (IDC), el 90% de los datos no estructurados no se analizan nunca (algunos hablan del 80%). Se trata de una ingente cantidad de información que obra en poder de las empresas y que estas no saben, no pueden o no quieren monetizar.

Isaac Sacolick, experto en transformación digital en StarCIO, aporta una definición más amplia del fenómeno de los datos oscuros. Coincide en que se trata de información almacenada por la empresa que no es analizada ni utilizada y describe tres posibles tipos:

  • Datos que existen en el seno de la empresa y en un formato accesible que no han utilizados hasta el momento.
  • Datos que están en poder de la empresa, pero que se encuentran en formatos que resulta muy costoso procesar para su uso.
  • Datos que no son capturados por la empresa o que se encuentran fuera de su rango de actuación.

Para hacernos una idea de este concepto podemos describir a modo de ejemplo algunas categorías de información que se pueden considerar como Dark Data: información diversa que deja el cliente en sus relaciones con la empresa, archivos de registro (log files), información de antiguos empleados, datos sin procesar de encuestas realizadas, registros de llamadas de clientes, coordenadas de geolocalización, registros de todo tipo de sensores, cadenas de correos electrónicos…

Realmente cualquier pista o rastro que dejamos en la red, por banal o insignificante que parezca, puede ser utilizado por una empresa para conocernos mejor o estudiar nuestro comportamiento. De ahí que algunos vean en el Dark Data una poderosa herramienta de marketing.

El tema es que aparentemente los denominados datos oscuros parecen ser morralla sin valor que nos llega sin querer y, sin embargo, si los combinamos con otros datos que, bien recopilamos para algún fin, bien compramos para explotar comercialmente, podemos encontrar una importante fuente de valor añadido sobre los entresijos de los comportamientos de los consumidores que nos aporte una ventaja competitiva frente a la competencia.

La propia Gartner, que nos aportaba un poco más arriba la definición del fenómeno, se muestra cautelosa -si no escéptica-, acerca de la posible utilidad de toda esta información oscura. Con un ímpetu abiertamente desmitificador, desmonta la supuesta máquina de hacer dinero que algunos ven en estos retales de información, o cuando menos, matiza acerca de sus aireados beneficios potenciales. Básicamente, nos recomienda: “a no ser que usted, el que lleva el negocio, tenga alguna idea sobre qué le quiere preguntar a este Dark Data, no tiene sentido preocuparse por ello”. Lo que nos quiere transmitir es que toda esta información en bruto nos tiene que ayudar a probar una idea, una teoría o responder a una pregunta que hagamos relacionada con el marketing de negocio, y si no es así, no es más útil que los muebles viejos que no tiramos y guardamos en el desván, “por si algún día nos hacen falta”.

Aparte de que el Dark Data pueda ser un activo estratégico o no para la empresa, hay quien ve en este fenómeno un riesgo potencial para el negocio, que puede abrir brechas de seguridad e incluso traer consigo problemas legales. Ed Tittel de CIO.com resume los peligros que vislumbra en los datos oscuros, tanto si son utilizados por un negocio en concreto como si lo hace su competencia:

  • La protección legal de gran cantidad de datos (financieros, confidenciales, sanitarios…) puede convertir en un delito su uso por la empresa.
  • Podría hacerse pública, al explotar el Dark Data, información estratégica sensible de negocio, como las operaciones, las alianzas o los factores de ventaja competitiva, poniendo en riesgo el funcionamiento comercial de la organización.
  • Cualquier posible brecha o fuga de información de la empresa redunda negativamente en la reputación de la organización.
  • Si una empresa ha decidido no invertir en explotar sus Dark Data podría llegar algún agente de la competencia para aprovecharse de ellos y de la pérdida de inteligencia competitiva.

El progresivo despliegue del Internet de las Cosas (IoT) no hará sino aumentar el universo del Dark Data. Un crecimiento exponencial del número de dispositivos y sensores, que se prevé de más de 20 de billones para 2050, sin duda multiplica la cantidad de información volcada en la red, de forma, que las estimaciones arrojan que la IoT generará ya en 2019 una cantidad de datos 269 más grande que la que se transmite entre centros de datos o entre dispositivos, y la mayor parte será Dark Data. 

lunes, 19 de noviembre de 2018

Videojuegos, la gran apuesta de la realidad virtual

La realidad virtual es la eterna candidata a producir el próximo salto tecnológico que transforme el modo en que hacemos muchas cosas cotidianas. Y, sin embargo, parece que su adopción y difusión se retrasa, incluso en un sector como los videojuegos, que parece el candidato idóneo para convertirse en la cabeza de playa del desembarco de esta tecnología.

Mark Zuckerberg compró Oculus VR hace algún tiempo con el fin de introducir la realidad virtual en Facebook, pero el año pasado tuvo que reconocer que integrar la nueva tecnología es mucho más complejo de lo que parecía inicialmente y que quizá tenga que invertir más dinero para alcanzar los objetivos que se había fijado.

De acuerdo con Digi-capital, el mercado mundial de realidad virtual en 2016 alcanzó tan solo una cifra de 2.700 millones, frente a unas previsiones iniciales de 3.800 millones.  Otra fuente, SuperData, reduce incluso dicha cifra, situándola en 1.800 millones.

El del videojuego es el sector candidato a liderar la penetración de la realidad virtual, cuando esta se produzca, porque es una tecnología que produce la inmersión total del jugador en la acción. El usuario gracias a la realidad virtual ya no estará frente a una pantalla sino dentro de la misma.

No obstante, la penetración de la realidad virtual en el mundo del videojuego es todavía reducida, como apunta el estudio Libro blanco del desarrollo español de videojuegos 2017, recientemente publicado por DEV (Desarrollo Español de Videojuegos). Según los datos ofrecidos, en 2016 se vendieron en el mundo 6,3 millones de dispositivos de realidad virtual, de los cuales 4,5 millones fueron Samsung Gear VR. DEV considera muy baja esta cifra y atribuye la baja penetración al elevado precio de los equipos.

La gran sorpresa en 2016 fue el éxito de la realidad aumentada, 1.200 millones de dólares en ventas, gracias sobre todo al boom del juego Pokémon Go de Nintendo y Niantic, que generó 600 millones de dólares en noventa días.

A pesar de no cumplir las expectativas a corto plazo, se sigue apostando por las tecnologías de realidad extendida (XR) como importantes generadoras de ingresos, de forma que, en el caso de la realidad aumentada, hablaríamos de la posibilidad de que represente el 77% de un mercado de 108.000 millones de dólares en 2021, siendo su aplicación a los juegos una cifra en torno a los 18.000 millones de dólares.

Los inversores parecen confiar en el potencial de las tecnologías de XR pues las startups del sector captaron el pasado año hasta 2.500 millones de dólares, un 10% de ellos destinados a los videojuegos.
El estudio de DEV destaca que el smartphone es el terminal favorito para el despegue de la realidad aumentada, dado lo favorable de sus características para albergar esta tecnología:
  1. Son altamente atractivos y deseables (tienen ciclos cortos de remplazo).
  2. Sus baterías duran un día entero.
  3. Permiten la conectividad en movilidad.
  4. Se benefician de un amplio ecosistema de aplicaciones y subsidios por parte de los operadores.
Se prevé el lanzamiento en 2018 de terminales de Apple y Samsung específicamente preparados para aplicaciones de realidad aumentada.

En España el 40% de las empresas del sector de videojuegos está llevando a cabo desarrollos para plataformas de realidad virtual y más de la mitad de las mismas pretende hacerlo en un futuro cercano. Con la realidad aumentada las cifras son más modestas: el 29% está ya desarrollando aplicaciones y el 39% pretende hacerlo en breve.

Es significativo, como muestra de las expectativas que generan estas tecnologías, que de los perfiles profesionales del sector que más demanda van a conocer en los próximos cinco años, el de experto en VR y AR aparece en tercer lugar en importancia, solamente superado por el de programados y los relacionados con el marketing y la distribución.

Aun sin haber cuajado en el mercado, la tecnología de la realidad virtual en el videojuego ya ha iniciado su evolución por nuevos caminos, como la incorporación de la inteligencia artificial, el reconocimiento de voz o la copresencia, es decir, la posibilidad de que dos jugadores puedan compartir el mismo mundo virtual.

Sin embargo, el despegue de esta tecnología requiere solucionar problemas de índole comercial, como puede ser el elevado precio de los equipos, así como el generar una masa crítica de demanda que tire del desarrollo del sector. También existen obstáculos relacionados con la adaptación del organismo humano a la tecnología inmersiva, pues un gran número de usuarios se marea y siente nauseas al utilizarla.

lunes, 5 de noviembre de 2018

El club de la lucha de los algoritmos

Cada vez son más las voces que se alzan avisando del peligro que supone para el ser humano el desarrollo de sistemas de inteligencia artificial cada vez más perfectos. Si a ello le sumamos la posibilidad de crear algoritmos deliberadamente diseñados para atacar y confundir a sistemas inteligentes, la capacidad para hacer daño crece de forma exponencial. Aunque suene pintoresco, una solución pasa por enseñar a los algoritmos a defenderse y pelear contra atacantes malintencionados. Y para ello se ha creado una suerte de club de la lucha para sistemas de inteligencia artificial.

Las máquinas inteligentes que aprenden se pueden diseñar para ayudar a las personas, para hacernos la vida más fácil, pero también pueden ser utilizadas para cometer cibercrímenes. Incluso los algoritmos más sofisticados pueden ser engañados. Por ejemplo, un filtro antispam puede ser evitado si se descubren los patrones que utiliza para clasificar el correo electrónico como no deseado. También algoritmos basados en redes neuronales profundas destinados a identificar objetos al reconocerlos en imágenes pueden ser fácilmente confundidos.

Los expertos advierten que tanto los hackers y la ciberseguridad se dirigen hacia la senda de la inteligencia artificial. El investigador de Google Brain Ian Goodfellow lo tiene claro: “los malos utilizaran las máquinas que aprenden (machine learning) para automatizar sus ataques y nosotros utilizaremos el machine learning para defendernos”.

Las posibilidades de delinquir engañando a los sistemas inteligentes son infinitas, desde suplantar la personalidad troleando a los sistemas de reconocimiento facial o de voz, hasta desorientar y confundir a los sensores de los coches autónomos para causar un accidente.

Ante este panorama alarmante, existe una línea de la ciberseguridad que se encarga de entrenar a los algoritmos para defenderse de los ciberataques de los sistemas adversos que intentan engañarles. En suma, les enseñan a pelear.

La plataforma para las competiciones científicas Kaggle ha organizado una curiosa competición que durará varios meses en la que los algoritmos “combaten” entre sí, como si estuviesen subidos en un ring de boxeo (Competition on Adversarial Attacks and Defenses). El objeto de cada uno de los sistemas inteligentes participantes es intentar engañar a los otros y/o defenderse de ataques. De esta forma los investigadores que hay detrás del proyecto pueden analizar su grado de resistencia ante posibles ciberataques y poder fortalecerles en consecuencia.

Por una parte, se trata de descubrir cómo engañar a una red neuronal y por otra cómo construir redes neuronales que no se dejen engañar.

La competición tiene tres categorías, por así decirlo:
  • Ataque adverso sin objetivo (Non-targeted Adversarial Attack). La meta de este ataque consiste en modificar levemente una imagen para conseguir que un sistema inteligente la clasifique incorrectamente.
  • Ataque adverso con objetivo (Targeted Adversarial Attack). En este caso la modificación de una imagen persigue que la inteligencia artificial la clasifique incorrectamente como algo concreto previamente definido.
  • Defensa ante ataque adverso (Defense Against Adversarial Attack). Construir un clasificador inteligente que sea inmune a los ataques adversos.
Kaggle, que es parte de Google Cloud, supone un valioso campo de experimentación en inteligencia artificial. Además, sus responsables consideran que la difusión de este “club de la lucha de algoritmos” puede atraer la atención pública sobre los riesgos asociados a las máquinas inteligentes en un momento en que su presencia se va haciendo cada vez más visible en muchos ámbitos de la sociedad.
 
Google Analytics Alternative