Mostrando entradas con la etiqueta Estadística-probabilidad. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadística-probabilidad. Mostrar todas las entradas

viernes, 20 de diciembre de 2013

Falacia del jugador

Como todas las navidades se acerca el sorteo extraordinario de Navidad. Este sorteo que me ha acompañado desde mi niñez era un suceso extraordinario que nos llenaba de ilusión y que nos hacía soñar por un momento que todo podía cambiar y podríamos cumplir todos nuestros deseos, fue mi primer contacto sin saberlo entonces con el azar, la probabilidad, la suerte. 

Todos soñábamos que nos tocaba, que por fin podríamos tener todo aquello que nos faltaba y que era mucho, y con el paso de los años todo sigue igual la ilusión puede más que la razón. Es el único sorteo de la lotería en el que compro algún décimo y sigo soñando y  deseando que me toca el premio gordo, a veces es difícil distinguir los deseos de los sueños, y siempre invariablemente lo más que le toca a uno es la pedrea, claro después de todo la probabilidad de que me toque el premio gordo es de 1/100000 o sea 0,001% probabilidad bastante baja pero que carajo siempre le toca a alguien, porque no vamos a ser nosotros el que tenga el décimo ganador.

La verdad es que los seres humanos no somos muy buenos calculando probabilidades, tenemos nuestras limitaciones. Nuestro cerebro intenta buscar sentido a algo que carece de ello y cuando se enfrenta a fenómenos probabilísticos  la intuición falla.

Muchas veces se da lo que denominamos falacia del jugador también conocida
como falacia de Montecarlo, en 1913 en la ruleta del casino de Montecarlo salió NEGRO 15 veces seguidas y los jugadores presentes comenzaron a apostar por ROJO aumentando sus apuestas creyendo que ya tocaba y que se iban a forrar, pero aquel día salió NEGRO 26 veces seguidas lo que lleno de millones de francos al casino y dejo a muchos jugadores con cara de tonto y los bolsillos vacios, pensaron que después de muchos NEGROS aumentaban las probabilidades de que saliera ROJO.

Esta falacia lógica que se da bastante consiste en calcular la probabilidad de un suceso futuro a partir de los sucesos que se han dado en el pasado cuando la ocurrencia de los sucesos son independiente, y comprende distintas ideas equivocadas.

  • Un suceso aleatorio tiene más probabilidad de ocurrir porque no ha ocurrido durante cierto período, cómo el que ya hemos comentado con la ruleta o el pensar que si llevamos 10 años jugando todas las semanas a la primitiva ya es hora de que nos toque un premio importante.
  • Un suceso aleatorio tiene menos probabilidad de ocurrir porque ha ocurrido durante cierto período, por ejemplo creer que como nuestro equipo de fútbol ha ganado los últimos diez partidos  cada vez hay menos probabilidad de que gane lo siguientes. 
  • Un suceso aleatorio tiene más probabilidad de ocurrir si no ocurrió recientemente, pensar que ya es hora de que gane mi equipo ya que lleva tres partidos perdidos.
  • Un suceso aleatorio tiene menos probabilidad de ocurrir si ocurrió recientemente, ha salido cara voy a pensar que es más probable que salgo cruz.




viernes, 22 de noviembre de 2013

Big Data



"Big data. La revolución de los datos masivos" de Viktor Mayer-Schönberger y Kenneth Cukier dos de los expertos más reconocidos internacionalmente en el mundo de datos masivos, el primero profesor de regulación y gestión de internet en el Internet Institut de la Universidad de Oxford con decenas de artículos y ocho libros escritos siendo asesor de diversas empresas entre ellas Microsoft y el Foro Económico Mundial y el segundo es el editor de datos de la revista The Economist. 

No se si somos muy conscientes de la gran cantidad de datos que generamos diariamente, desde que nos levantamos y consultamos el móvil, hacemos una llamada, accedemos a internet en el trabajo o en casa, realizamos búsquedas en google, visionamos un vídeo en youtube, utilizamos facebook o twitter, leemos en nuestro ebook, pagamos con la tarjeta de crédito, consumimos, utilizamos la tarjeta transporte, encendemos la tv o nos entretenemos jugando en el móvil o en la play, este libro ayuda a que seamos conscientes de esta gran cantidad de datos que generamos en nuestra vida cotidiana y del uso que hacen y pueden hacer de ellos. 

Millones de clic que se transforma en datos y que no desaparecen en la red mundial, sino que son almacenados para posteriormente ser utilizados por las grandes corporaciones y gobiernos para quién sabe que intereses. Este ensayo nos introduce en este mundo de los datos masivos, y como su uso transformará la sociedad produciéndose una revolución de la que no somos muy conscientes. Ensayo apasionante donde nos alertan de los riesgos de los datos masivos utilizados de forma torcedera y de la necesidad de su control.  

RESEÑA DEL EDITOR
Un análisis esclarecedor sobre uno de los grandes temas de nuestro tiempo, y sobre el inmenso impacto que tendrá en la economía, la ciencia y la sociedad en general.
¿Qué color de pintura es más probable que le diga si un vehículo de segunda mano está en buen estado? ¿Cómo puede identificar un ayuntamiento cuáles son los baches más peligrosos de una ciudad? ¿Y cómo pueden predecir las búsquedas de Google la propagación de una epidemia de gripe aviar? La clave para responder a todas estas preguntas son los datos masivos, los Big data. Este término hace referencia a la ingente cantidad de información que proviene de la red, una información que hoy estamos en condiciones de procesar, analizar, tabular y utilizar...para bien o para mal. Los datos masivos representan una revolución que ya está cambiando la forma de hacer negocios, la sanidad, la política, la educación y la innovación. A la vez, significan el fin de la privacidad tal como la considerábamos hasta ahora.

Viktor Mayer-Schönberger and Kenneth Cukier | Source: Courtesy Photo
Dos grandes experto en datos nos brindan un ensayo accesible para el lector común sobre el mundo big data, cómo nos puede cambiar la vida, y qué podemos hacer frente a sus riesgos.

ÍNDICE

I      Ahora.
II     Más.
III    Confusión.
IV    Correlación.
V     Datificación
VI    Valor.
VII   Implicaciones.
VIII  Riesgos.
IX    Control.
X     A partir de ahora.
Agradecimientos.
Notas
Bibliografía

TEXTOS
"Los datos masivos consisten en ver y comprender las relaciones en
el seno y entre distintos fragmentos de información que, hasta hace muy poco, nos esforzábamos por captar plenamente. Jeff Jonas, el experto en datos masivos de IBM, sostiene que hay que dejar que los datos 'le hablen a uno'. En cierto modo, esto puede parecer obvio, porque los seres humanos hemos prestado atención a los datos para intentar conocer el mundo desde hace mucho tiempo, bien en el sentido informal, el de las innumerables observaciones que hacemos a diario o, fundamentalmente  a lo largo del último par de siglos, en el sentido formal de unidades cuantificadas que pueden manipularse con algoritmos poderosos". Pág. 33.
"El enfoque de los datos masivos, que pone el acento en los conjuntos de datos de gran extensión y en la confusión, nos ayuda a acercarnos a la realidad más que nuestra antigua dependencia de los datos escasos y la exactitud...". Pág 67.
"Los datos masivos transforman nuestra forma de comprender y explorar el mundo. en la era de los datos escasos, nos guiábamos por las hipótesis sobre cómo funcionaba el mundo, que luego intentábamos validar recopilando y analizando datos. En el futuro, nuestro entendimiento será guiado más por la abundancia de datos que por las hipótesis". Pág. 82.
"Ver el mundo como información, como océanos de datos que pueden explorarse cada vez más lejos y más hondo, nos ofrece un nuevo panorama de la realidad. Es una perspectiva mental que puede penetrar todas las áreas de la vida. Hoy formamos una sociedad aritmética porque presumimos que el mundo se puede comprender mediante los números y las matemáticas. Y damos por supuesto que el conocimiento se puede transmitir a través del tiempo y del espacio porque el concepto de la escritura está muy arraigado. Puede que el día de mañana las generaciones siguientes tengan una conciencia de datos masivos: la presunción de que hay un componente cuantitativo en todo cuanto hacemos, y de que los datos son indispensables para que la sociedad aprenda. La noción de transformar las innumerables dimensiones de la realidad en datos probablemente le parezca novedosa por ahora a la mayoría de la gente. Pero en el futuro, seguramente la trataremos como algo dado (lo cual, de forma agradable, nos retrotrae al origen mismo del término "dato")". Pág. 123.
"Lo esencial del valor de los datos es su potencial de reutilización aparentemente ilimitado: su valor de opción. Recopilar la información resulta crucial, pero no lo suficiente, ya que la mayor parte del valor de los datos se halla en su uso, no en su mera posesión...". Pág. 154.
"Las matemáticas y la estadística, tal vez con una pizca de programación y de ciencia de las redes, resultarán tan fundamentales para el puesto de trabajo moderno como lo eran hace un siglo los conocimientos básicos de aritmética, y la capacidad de leer y escribir antes aún".Pág 178.

domingo, 2 de junio de 2013

2013 Año Internacional de la Estadística

Exposición de carteles con motivo del año internacional de la estadística que se pudo visitar del 7 al 20 de mayo de 2013 en la Casa del estudiante de la UPCT



      

     

    

   
    
Imágenes obtenidas en http://nadandoenunmardedatos.blogspot.com.es/

viernes, 22 de junio de 2012

Cómo mentir con estadísticas

"Cómo mentir con estadísticas" (How to Lie With Statistisc) de Darrell Huff  y con las ilustraciones de Irving Geis es posiblemente el libro de estadística más leído en el último medio siglo y paradójicamente él no era un experto estadístico sino un escritor especializado en libros prácticos.   En un libro de apenas 145 páginas nos va presentando de una forma clara y sencilla llena de humor los trucos y la forma como utilizan las estadísticas los políticos, empresarios, periodistas, publicitarios, etc. y como emplean  las estadísticas para sustentar lo que nos quieren vender engañando y manipulando los hechos, retorciendo los datos para que "canten" y nos cuenten lo que ellos quieren en defensa de sus intereses. Más de uno creemos que sería un libro que se debería de estudiar en el último curso de la ESO para preparar a los estudiantes y futuros ciudadanos frente a la manipulación estadística que les rodeará en su vida y poder utilizar estros trucos "en defensa propia".

En su último capítulo "Cómo enfrentarse a las estadísticas" nos da una serie de consejos y precauciones que debemos de seguir a la hora de enfrentarnos a la información estadísticas que caigan en nuestras manos y poder defendernos de los desaprensivos que utilizan las estadísticas para engañarnos, así ante cualquier información estadísticas deberíamos preguntarnos:
  • ¿Quién lo dice? "Lo primero que debe mirar es en qué sentido puede estar influida la información: el laboratorio que necesita demostrar algo para beneficio de una teoría, una reputación o unos honorarios, el periódico cuya finalidad es publicar un buen artículo; los obreros y los patronos que discuten un aumento de salarios; etc." 
  • ¿Cómo lo sabe? Importantísimo es saber cómo se han obtenido los datos, fijarse en la ficha técnica del estudio muy importante el tamaño de la muestra los datos sobre el error muestral, etc.. Si no sabemos cómo se ha hecho el estudio estadístico no podemos valorar los resultados .
  • ¿Qué falta? Hay alguna parte de la población que no está representada en la muestra, falta algún dato, nos falta elementos de comparación... por ejemplo en las encuestas sobre intención de votos suele ocultar o estar infravaloradas los datos de los que no saben o no contestan. 
  • ¿Dio alguien cierto giro a la información? "Cuando compruebe una estadística, busque la posible tendencia que alguien haya podido introducir en las cifras totales o en las conclusiones.  Con frecuencia se da a conocer una cosa en lugar de la otra".
  • ¿Tiene sentido? "Esta pregunta rebajará la importancia de la estadística cuando el galimatías se base en un supuesto no probado". Por mucho que lo digan "las estadísticas" si no tiene sentido, contradice el sentido común o da resultados absurdos habría que desconfiar, ningún estudio estadístico es fiable al 100 por cien por mucho que este elaborado por la Universidad de Villarriba o por el Centro de Investigaciones Sociológicas de Villabajo.



RESEÑA
"Este libro -nos dice Darrel Huff- es un manual sobre la manera de utilizar las estadísticas para engañar". Lo que este título -todo un clásico, desde su primera edición en 1954- escrito con ingenio y humor nos ofrece es, en realidad, un curso de sentido común para aprender a descubrir los ardides con los que cada día pretenden engañarnos, manipulando cifras y gráficas, los medios de comunicación, los polítios, la publicidad... Lo que aquí se nos cuenta resulta divertido; pero es bueno tomarlo en serio, porque, como nos dice el autor, "los desaprensivos ya conocen estos trucos; los hombres honrados deben aprenderlos en defensa propia".
ÍNDICE
Introducción.
1. La muestra que presenta un factor de influencia en sí misma.
2. El promedio bien escogido.
3. Las pequeñas cifras que no aparecen.
4. Mucho ruido y pocas nueces.
5. El gráfico exclamativo.
6. El personaje de la gráfica.
7. La cifra indirectamente relacionada.
8. el "post hoc" aparece de nuevo.
9. Cómo "estadistiquear".
10. Cómo enfrentarse con las estadísiticas.
TEXTOS
"El lenguaje secreto de las estadísticas, tan atrayente a una cultura que se basa en los hechos, se emplea para causar sensación, deformar, confundir y simplificar en demasía. Los métodos y los términos estadísticos son necesarios para informar sobre los datos masivos de las tendencias sociales y económicas, las situaciones de los negocios, las encuestas de opinión y los censos; pero sin escritores que utilicen las palabras con honradez y precisión y sin lectores que sepan lo que significan, el resultado no es más que pura semántica sin sentido alguno". Pág.2.
"Si no puede probar lo que desea, demuestre otra cosa y haga ver que es lo mismo. En el deslumbramiento que sigue al choque de las estadísticas con el cerebro humano, casi nadie se dará cuenta de la diferencia. La cifra que se relaciona indirectamente es un truco garantizado que le será de utilidad. Siempre lo ha sido". Pág. 69.
"Existen muchas formas de reunir datos y muchas más de utilizarlos después para facilitar informaciones distintas. El método más empleado consiste en tomar dos cosas que suenen igual pero que no lo sean. Como jefe de personal de una empresa que está en pugna con el sindicato, lleva usted a cabo una encuesta entre los empleados para averiguar cuántos tienen alguna queja del sindicato. A menos que el sindicato sea un coro de ángeles con un árcangel a la cabeza, le será posible formular las preguntas y respuestas con toda honradez, llegando a la conclusión de que la mayor parte de los hombres de su empresa tienen una queja u otra. Publica usted sus resultados, informando de que 'una vasta mayoría -el 78 por 100- se opone al sindicato'. Lo que ha hecho es sumar una serie de quejas indiferenciadas y de pequeños resquemores y después bautizar al conjunto con otro nombre que parece la misma cosa. Usted no ha probado nada, pero parece como si lo hiciera ¿verdad?". Pág. 74-75.
"Existen, a menudo, muchas maneras de expresar cualquier cifra. Usted puede, por ejemplo, expresar el mismo hecho lalmándolo: un 1 por 100 de rédito sobre las ventas, un 15 por 100 sobre el capital invertido, un beneficio de diez millones de dólares, un aumento del 40 por 100 en los beneficios (comparados con la media de los años 1935-1939), o una disminución del 60 por 100 en los mismos (comparados con los del años pasado). El método consiste en escoger lo más adecuado a la finalidad que nos proponemos y confiar en que pocos entre quienes lo lean se darán cuenta de que se ha reflejado imperfectamente la situación". Pág 76-77.
"Posiblemente sea de mayor importancia tener en cuenta que la tergiversación de datos estadísticos y su manipulación para conseguir una finalidad determinada no son siempre obra de los profesionales de la estadística. Lo que sale lleno de virtudes de la mesa del experto puede verse cambiado, exagerado, demasiado simplificado y tergiversado al haber tomado solamente una parte los vendedores, expertos en relaciones públicas, periodistas y redactores de textos publicitarios". Pág. 97.
"El hecho es que, a pesar de su base matemática, las estadísticas son tanto una arte como como una ciencia. Muchas manipulaciones y tergiversaciones son posible dentro de los límites de su jurisdicción. A menudo, el experto en estadísticas debe escoger entre distintos métodos, lo que no deja de ser un proceso subjetivo, y hallar el que debe utilizar para representar los hechos. En la práctica comercial hay tan pocas probabilidades de seleccionar un método desfavorable, como de que el redactor de textos llame endeble y barato al producto del patrocinador de su anuncio, cuando tiene la posibilidad de llamarlo ligero y económico". Pág. 117.
"Esto nos demuestra la necesidad de mirar dos veces el material estadístico, los hechos y las cifras de los periódicos y los libros, las revistas y la publicidad, antes de aceptarlos. A veces, bizquear un poco agudiza el foco. Pero tampoco tiene sentido rehusar arbitrariamente los métodos estadísticos. Es como si quisiéramos dejar de leer porque los escritores a veces utilizan las palabras para ocultar hechos y relaciones en lugar de mostrarlos a la luz". Pág. 117.

martes, 28 de diciembre de 2010

Teorema de los infinitos monos

Este curioso teorema, cuya idea original fue planteada por Émile Borel en 1913, afirma que un mono pulsando teclas al azar sobre un teclado durante un tiempo infinito casi seguramente podría escribir finalmente las obras de Willian Shakespeare, en otras variaciones del mismo son cualquier obra de la Biblioteca Nacional Francesa, e incluso en lugar de un mono eran infinitos monos aunque la verdad es irrelevante que sean uno o más ya que casi con toda seguridad acabarían escribiendo cualquier texto dado. El teorema se puede generalizar, pues cualquier experimento aleatorio podrá producir un determinado resultado siempre que la experiencia se realiza tantas veces como sea necesario, así si tiramos una moneda al aire un número infinito de veces (ni Chuck Norris) teóricamente es casi con toda seguridad que encontraremos rachas tan poco probable como conseguir un millón de caras.

Lo curioso del teorema es la posibilidad teórica y jugar con el término infinito, ya que  prácticamente el tiempo requerido para que un mono escribiera el texto de Hamlet sería bastante superior a la edad del universo. Así por ejemplo en las primeras 20 letras del Quijote "En un lugar de la Ma..." sin tener en cuenta las mayúsculas y los signos de puntuación, las probabilidades de que sean las correctas es de una entre 2620 =19.928.148.895.209.409.152.340.197.376 lo que es bastante improbable pero si contamos con todo el tiempo del mundo hay una posibilidad teórica. Para hacernos una remota idea de los tiempos si por ejemplo tenemos un mono escribiendo letras al azar (algo realmente difícil) a un ritmo de 60 caracteres por minuto escribiría 60x60x24=86.400 caracteres al día, estadísticamente hablando el mono podría escribir "Mancha" (hacer coincidir los 6 caracteres nos da una probabilidad  de 1/26x1/26x1/26x1/26x1/26x1/26=1/308.915.776) en  3.575,41 días aproximadamente en 9,8 años   imaginemos para escribir el texto completo. La verdad que el concepto de infinito deja de tener sentido práctico, ya que cuando hablamos de infinitos monos hablamos de más monos que partículas tiene el universo (1080) y cuando nos referimos a infinito tiempo hablamos de muchísimo más tiempo que mil veces la edad del Universo (13.700 millones de años) así el concepto infinito se reduce a una mera herramienta teórica.
Émile Borel utilizó la metáfora de los infinitos monos para ilustrar la magnitud de un acontecimiento extraordinariamente improbable. En su libro "Las probabilidades y la vida" que leí hace ya veinte años analiza en su capítulo tres "las probabilidades negligibles y las probabilidades de la vida cotidiana" las probabilidades despreciable a escala humana, a escala terrestre, a escala cósmica, a escala supescósmica y las probabilidades y la vida práctica; así en la escala humana señala que 'diremos que una probabilidad es despreciable a escala humana cuando los hombres más prudentes y más razonables deben de tratarla como si esta probabilidad fuese nula' y da la cifra de probabilidad inferior a la millonésima (10-6) como razonable, para hacernos una idea la probabilidad de acertar los 6 números sobre 49 de la primitiva es de uno entre las 13.983.816 posibles combinaciones es decir 0,0000000715 (7,15*10-8), bastante inferior a la probabilidad despreciable a escala humana que nos señala Émile Borel, podríamos estar durante 268.920 años haciendo cada semana la primitiva y posiblemente no nos tocaría nunca, pero a pesar de todo esto uno sin saber muy bien porque quien sabe si siguiendo la parte más irracional de uno, de vez en cuando juega con la vana esperanza que le toque, aunque quizás tenga más que ver con la esperanza matemática pero esto es otro asunto.

 
En esta página web The Fantastic Typing CyberMonkey tenemos una simulación en la que dentro de un espacio en blanco aparece aleatoriamente  una secuencia de letras mientras un mono aporrea una máquina de escribir podemos pasarnos horas viendo que pasa y esperar si aparece alguna palabra con sentido, es sólo una idea para pasar una plácida tarde de domingo.


Referencia de este teorema lo tenemos en la serie los Simpson en el episodio "Última salida a Springfield" el Sr. Burns  enseña a Homer una habitación y dice:

"Estos son mil monos con mil maquinas de escribir. Pronto habrán terminado la novela más grande de la historia, veamos… “Estávamos tan contentos...”. “Estábamos” va con “v”, mono tonto, estúpido – Uua uaa uaa! – Cállate!"


lunes, 4 de octubre de 2010

El tigre que no está



El tigre que no está. Un paseo por la jungla de la estadística de Michael Blastland (periodista, escritor y comunicador de la BBC) y Andrew Dilnot (rector del St. Hugh's College de la Universidad de Oxford), libro interesante en que los autores con un lenguaje divertido y didáctico pasan revista a la forma en que los políticos y periodistas utilizan los términos estadísticos, interpretan las cifras y los porcentajes y en los continuos errores que caen demostrándonos lo analfabetos que son en todo lo relacionados con los gráficos, los números y la estadísticas; y al mismo tiempo nos muestran los trucos que utilizan para retorciendo los datos sacar conclusiones y interpretaciones falsas e interesadas de los hechos. 
A lo largo de los doce capítulos nos introduce sin utilizar ni una sola formula y empleando una gran cantidad de ejemplos, de la vida cotidiana y de los periódicos, en los entresijos de conceptos como la media, los rangos, el muestreo, los porcentajes, los índices, las correlaciones, los casos atípicos, la incertidumbre y otros términos estadístico; dándonos armas y trucos para interpretar las encuestas y cifras, y descubrir las mentiras y exageraciones de los datos estadísticos que nos dan los periodistas y los políticos. En conclusión libro totalmente recomendable para salir airosos de la jungla de la estadística.




RESEÑA
Un ministro le dice: "invertiremos cuatro mil millones de euros en mejorar la Sanidad"...Su médico le previene: "con cada copa, aumenta su riesgo de cáncer un 5%"...Un político le promete: "bajaremos los impuestos a los ciudadanos que ganan el sueldo medio"... ¿Sabe qué le están diciendo? ¿O le están haciendo ver un tigre donde sólo hay unas rayas? En este libro apasionante y accesible, lleno de ejemplos prácticos y de sentido común, los autores nos seguían a través de una jungla que pocas veces ha sido tan divertida de visitar: la de las cifras y su uso público.
"Si se exigiera a todo político y periodista que leyera este interesante y esclarecedor libro antes de empezar a ejercer, viviriamos en un mundo más sabio y mejor dirigido" Matthew Taylor, presidente de la Royal Society of Arts.
"...Una guía fiable sobre un asunto traicionero, que les da a sus lectores munición mental [y] se las arregla para hacerles reir al mismo tiempo; un festín poco frecuente y muy de agradecer" The Economist. 
ÍNDICE
Introducción.
I     Contar: use puré de verduras.
II    El tamaño: una cuestión personal.
III   La casualidad: el tigre que no está.
IV   Altibajos: un hombre y un perro.
V    La media: un arco iris blanco.
VI   Objetivos: el elefante completo.
VII  Riesgos: compre bacon.
VIII Muestreos: beber de la manguera.
IX   Datos: conocer lo desconocido.
X    Cifras increíbles: la bola que se sale del campo.
XI   Comparaciones: cuidado con el escalón.
XII  Correlaciones: piénselo dos veces.
Y para terminar.
Agradecimientos. Para seguir leyendo.


CITAS
"Los números saturan las noticias, la política, la vida. Para bien o para mal, son el lenguaje público más habitual hoy día, y quienes lo hablan son los que mandan. Pero a los números también se les odia, y frecuentemente por esa misma razón. Pueden confundir en vez de iluminar, aterrorizar en lugar de guiar, y con demasiada facilidad acaban siendo objeto de mal uso y desconfianza" pág. 11.
"La vida, además, es más complicada que los números; la vida es un cajón de sastre y los números son una caja. De ahí que, cuando queremos contar algo, tengamos que forzarlo para que adopte forma de número" pág. 17.
"Las cifras suben y bajan. Eso es todo. Nadie tiene que hacer nada especial para que sea así,
No hace falta tomar medidas. En el curso normal de la vida, pasan cosas. Pero no siempre suceden con absoluta regularidad ni en las mismas cantidades. Mida (casi) cualquier cosa, y algunos días habrá más y otros días menos. Los números ascienden y caen. Es así". Pág 69 
 "La medias engañan de dos formas. En primer lugar, pasan los tropezones y los grumos de la vida por la batidora. El mundo  puede ser un follón de mil demonios pero, una vez hallada la media. queda convertido en un superficie pulida... .La segunda forma de engaño viene de que las medias pasan por normas cuando pueden ser la excepción. Parecen del montón, pero lo fácil es que no estén en ningún montón. Pueden considerarse lo corriente, cuando quizá se definan por ser lo extraordinario. Aparenta estar en la mitad, cuando quizá se definan por ser lo extraordinario". Pág. 87
"La incertidumbre es cosa de la vida. Las cifras, que en muchas ocasiones son exactas, se usan a menudo para tratar de superar la incertidumbre, pero en esto hay que establecer un principio vital: muchas cifras serán inciertas, y no hay por qué echárselo en cara. Incluso un noventa por ciento de fiabilidad puede conllevar más incertidumbre de lo que parece. La moraleja es que, dado que la vida carece de certezas, y dado que esto lo sabemos por experiencia, no deberíamos esperar que los números sean una excepción;  si se usan con cuidado, pueden arrojar un poco de luz sobre la incertidumbre, pero no pueden ganarle la partida". Pág. 147 .
"Nunca hay que dar por supuesto que existe un método obvio para obtener una respuesta cierta. Muy pocas veces recibimos la respuesta completa, así que buscamos la forma de averiguar al menos una parte, y luego confiamos en la deducción y en nuestra capacidad de adivinar. Se toma una muestra pequeña de un todo mucho mayor, de un montón de datos que salen a borbotones, y esperamos que sirva: es como beber de una manguera de bomberos" pág. 163
"... mucha gente con estudios va por ahí dando opiniones sobre las principales cifras de los asuntos económicos y sociales, cuando en realidad no tiene ni la más remota idea de cuáles son esas cifras". Pág 184.
 "En una cultura donde se respetaran los datos, donde se pusiera el esfuerzo adecuado en recoger e interpretar la información estadística con cuidado y honradez, una cultura que valorara las estadísticas como herramienta de conocimiento y se tomara la molestia de averiguar qué dicen las cifras de las que ya disponen, que las viera como algo más que un juguete para políticos, una cultura así sería, en nuestra oinión, la mejora más valiosa para dirigir el gobierno y  la adopción de leyes que podría conseguir el país". Pág 195.
"Cuando se trata de hacer comparaciones, se multiplican exponencialmente todos los errores de definición, ya que volvemos a definir con cada comparación que hacemos. Repitamos la ya conocida esencia del problema: ¿estamos comparando iguales con iguales en todos los aspectos clave?" Pág. 219
"Buscar la causa verdadera sin descanso es una costumbre constructiva, un seguro contra la credulidad. Y aunque la correlación no prueba la causalidad, suele ser una buena pista; pero una pista para  empezar a hacer preguntas, no para quedarse con las respuestas fáciles". 
"Este Libro ha aspirado a la simplicidad. Y he aquí, con ánimo casi serio, la simplicidad simplificada: una guía de los principios básicos para viajar a través de los números, en una sola página.
  El tamaño es para dividirlo.
  Las cifras son limpias. La vida no.
  Quien cuenta es una persona (con dolor de espalda).
  La casualidad acecha.
  Las rayas no son tigres.
  Los altibajos existen.
  "Media=mitad": memez.
  No se ven totales por el ojo de la cerradura.
  Riesgo: personas.
  La mayor parte de los recuentos no lo son.
  Si no hay datos, no hay historia.
  Ellos tampoco lo saben.
  Los impactos fáciles yerran con facilidad.
  No es usted como un día de verano, perdone.
  Esto causa aquello... quizá."  Pág. 253



sábado, 10 de abril de 2010

Numerati

"Numerati. Lo saben todo de tí"  de Stephen Baker, periodista estadounidense especializado en economía, matemáticas y tecnología. Todos navegamos por internet, pagamos con tarjeta de crédito, utilizamos el móvil, hacemos compras en grandes superficies, utilizamos el transporte público o el coche particular, y un largo etcetera, y por todos los sitios que pasamos vamos dejando cientos de datos, que aísladamente no dicen mucho pero que reunidos pueden hacer una radiografía de nuestros gustos, intereses, ideas, opiniones. Al pensar en todo esto, algo se remueve en nuestro interior, ¿qué ha sido de la privacidad?, ¿qué datos tienen de nosotros? ¿quién tiene esos datos, qué empresas, que organismos públicos? ¿cómo pueden utilizarlos?. Respuestas a estas preguntas y otras son las que me animaron a la lectura de este libro, en el Stephen Baker analiza y sigue la pista a la cantidad de datos que vamos generando como empleados, consumidores, votantes, blogueros, pacientes y como parejas, y los rastros que dejan los terroristas. En el libro se dirige a empresas y a organismos del gobierno y entrevista a expertos sobre la materia descubriendo un poco sobre los datos que generan nuestra vida moderna y como estos datos son utilizados en distintos ámbitos y de acuerdo con nuestros distintos roles:

  • El empleado: los numerati recopilan datos del empleado para conocer como trabajamos, en que empresas hemos estado, la duración de nuestros empleos, el tiempo que estamos en el ordenador o en la línea de producción, a quiénes enviamos e-mails, nuestras redes sociales, etc. y todo ello con el objetivo de aumentar la productividad seleccionando a los más preparados.
  • El consumidor: los numerati recopilan incalculables montañas de datos de nuestras compras para clasificarnos de acuerdo a nuestros hábitos de consumo que les servirán para  diseñar campañas de publicidad más efectivas.
  • El votante: aquí intentan conocer como pensamos políticamente, cuales son nuestros valores y nuestras posiciones sobre temas de actualidad para diseñar el mensaje de los políticos y campañas más efectivas para que votemos a un partido concreto.
  • El bloguero: aquí los numerati están desarrollando programas que analizan automáticamente e inmediatamente los post que se publican sobre los temas de su interés de acuerdo con los objetivos de las empresas que los contratan, así pueden tener datos sobre la opinión que tienen los blogueros sobre determinados productos o servicios.
  • El terrorista: controlando a través de programas que analizan los e-mail, las compras de billetes de avión, los contactos con los móviles, alquileres, etc...
  • El paciente:  determinados datos revelan nuestro estado de salud (hábitos alimenticios, si hacemos deporte, consumimos alcohol, fumamos, medicamentos que consumimos).
  • La pareja: los datos sobre nuestra forma de ser, nuestros valores e intereses y todos aquellos que nos puedan describir pueden ser utilizados para la búsqueda de la pareja ideal utilizando sofisticados algoritmos que se van mejorando según van aumentado los datos sobre las predicciones efectuadas, analizándolas posteriormente de acuerdo con determinados parámetros. 
Todo esto nos crea un panorama un tanto desalentador que nos acerca a una sociedad orweliana, al final para tranquilizarnos el autor dice "Los numerati también lidian con una complejidad descomunal. Buscan pautas en datos que describen algo de un complicación casi inabordable: la vida y la conducta de los seres humanos. La audacia de su misión es alucinante. ¿Acaso van a deducir por quién vamos a votar, con quién deseamos trabajar, a quién podemos amar, todo a partir de modelos estadísticos? Es el colmo de la soberbia, y conduce a humillantes decepciones" aunque "...los numerati avanzan de manera paulatina. En realidad no nos conocen, ni nos conocerán jamás. Pero cada día, en todos los ámbitos, comprenden y predicen nuestra conducta un poco mejor. Aprenden de sus errores. Acumulan más datos. Siguen experimentando. Es un proceso científico y, de los laboratorios de publicidad al contraterrorismo, a cada uno de nosotros se nos ha concebido como espécimen. En algunos casos, nos desmenuzan al detalle; en otros, sólo toman nuestra esencia. Comoquiera que sea, no hay marcha atrás: en la era que se inicia, este análisis estadístico describirá, estudiará y predecirá nuestra vida cada vez más" o sea que vayámonos preparando para lo que nos espera y que todo sea para bien.


RESEÑA
"Numerati. Toman nota escrupulosamente. Registran los detalles de nuestra vida. Cuando enviamos un mensaje desde nuestro móvil, con cada clic en internet o cada compra realizada con tarjeta de crédito, van perfilando nuestra identidad. Datos insignificantes por separado, pero que, agrupados de la forma correcta, exponen nuestro rastro: la forma de relacionarnos; los hábitos de trabajo; cómo recorremos los centros comerciales o los supermercados. Si alguien recopilara y organizara estos fragmentos, nuestra vida saldría de pronto a la luz. Y como señala el investigador Stephen Baker, legiones de matemáticos, ingenieros e informáticos que tienen en su oder las huellas electrónicas de nuestros pasos podrían, con suma facilidad, descifrar nuestros gustos, temores y necesidades.
Son los numerati: personas especializadas en descodificar y organizar esta información, capaces de convertir en símbolos este complejo bombardeo informático. Un imperio de recopilaciones que usan ya para empresas privadas, gobiernos o partidos políticos. La pesadilla orwelliana que vaticinaba un contros absoluto de nuestra intimidad se ha hecho realidad: no estamos solos frente a nuestro ordenador como creíamos, y el derecho a la privacidad, en los tiempos que corren, podría ser una utopía en una época en que nos acecha un potencial de manipulación sobre la humanidad que nunca antes había registrado la historia"

INDICE
Introducción.
1. El empleado.
2. El consumidor.
3. El votante.
4. El bloguero.
5. El terrorista.
6. El paciente.
7. La pareja.
Conclusión.
Agradecimientos, Notas, Bibliografía y lecturas recomendadas.
Índice analítico.


Entrevísta llevada a cabo en Quo copiar aquí

jueves, 18 de febrero de 2010

¿Existe la suerte? Las trampas del azar.

¿Existe la suerte? Las trampas del azar de Nassim Nicholas Taleb "Este libro trata de la suerte, disfrazada y percibida como no suerte, (es decir, como habilidad) y, en general, del azar disfrazado y percibido como no azar (es decir, como determinismo)" 

Libro dividido en tres partes "La primera es una introspección sobre la advertencia de Solón, porque su exclamación sobre los sucesos raros se ha convertido en el lema de mi vida. En esta parte meditamos sobre las historias visibles e invisibles y la escurridiza propiedad de los sucesos raros (Cisnes negros). La segunda parte presenta una colección de sesgos de probabilidad que he visto (y padecido) en mi carrera en el mundo del azar: aquellos sesgos que me siguen engañando. La tercera ilustra mis gestas personales con mi biología y concluye el libro con una presentación de unas pocas ayudas prácticas (cera en mis oídos) y filosóficas (estoicismo)".
ÍNDICE

PRIMERA PARTE: La advertencia de Solón: sesgo, asimetría e inducción.
Uno: Si eres tan rico, ¿por qué no eres tan listo? (Nero Tulip. John el operador de éxito. Un verano ardiente. Su dentista es rico, muy rico).


Dos: Un extraño método contable.(Historia alternativa. Relaciones tranquilas con los compañeros. George Will no es Soló: sobre las verdades contra-intuitivas).


Tres: Un meditación matemática sobre la historia. (Diversión en mi ático. Pensamiento destilado en su PlamPilot).


Cuatro: Azar, sinsentidos y el intelecto científico. (El azar y el verbo. Poesía Montecarlo)

Cinco: Supervivencia del menos apto: ¿puede el azar engañar a la evolución? (Carlos, el mago de los mercados emergentes. John, el operador de títulos de alto rendimiento. Una revisión de las constantes de los engañados por el azar en los mercados. Teorías evolucionarias ingenuas),

Seis: Asimetría. (La mediana no es el mensaje. Zoología de toros y osos. Casi todo el mundo está por encima de la media. La falacia del suceso raro).

Siete: El problema de la inducción. (De Bacon a Humer, El promotor de sir Karl. Gracias Solón).

SEGUNDA PARTE: Monos sobre máquinas de escribir: sesgo de la supervivencia y otros sesgos.
Ocho: Hay demasiados millonarios en la puerta de al lado. (Cómo detener el aguijón del fracaso. Doble sesgo de suepervivencia. La opinión de un gurú).

Nueve: Es más fácil comprar y vender que freír un huevo. (Engañados por los números. La vida es coincidencia. Suerte Comparativa. No tengo ninguna conclusión).

Diez: El perdedor se lo lleva todo: sobre las no linealidades de la vida.(El efecto del montón de arena. Matemáticas dentro y fuera del mundo real. A perro flaco todo son pulgas).

Once: El azar y nuestro cerebro: estamos cegados por la probabilidad. (¿París o Bahamas. Algunas consideraciónes arquitectóncas? Cuidado con el burócrata filósofo. Con Fallos, no sólo Imperfecto-Kahnema y Tversky. ¿Dónde esta Napoleón cuando le necesitamos? Por qué no nos casamos con nuestra primera novia. Probabilidades y los medios).

TERCERA PARTE: Cera en mis oídos: vivir con azaritis.
Doce: Tics de jugador y palomas en una caja. (Inglés de taxista y causalidad. El experimento de la paloma de Skinner. Philostratus Redux).

Trece: Carnéades llega a Roma: sobre la probabilidad y el escepticismo. (Carnéades llega a Roma. Las opiniones de monsieru de Norpois).

Catorce: Baco abandona a Antonio. (Notas sobre el funeral de Jackie O. El azar y la elegancia personal).

Epílogo: Solón le advirtió-
RESEÑA


Todo el mundo quiere tener suerte en la vida. Pero ¿qué hace que algunos de nosotros tengamos más éxito que otros? ¿Tiene que ver realmente con nuestras capacidades y estrategias, o con algo mucho más impredecible? 

Este libro trata de la suerte o, para ser más precisos, de cómo percibimos la suerte en nuestras experiencias personales y profesionales. Esto resulta obvio en el ámbito de los mercados (nos dicen que tal empresario tiene «visión de futuro» o que determinado financiero tiene «talento»), pero demasiado a menudo su rendimiento se debe más a la suerte que a sus capacidades. El problema reside en que nos cuesta mucho entender la probabilidad, y por ello seguimos creyendo que lo que sucede no es aleatorio y nos empeñamos en encontrar razones allá donde no las hay.

A lo largo de las páginas de este libro, lleno de anécdotas y de historias sorprendentes, Taleb hace desfilar a diferentes personajes que han conseguido comprender, cada a su manera, la importancia de la suerte: Desde Solón, uno de los mayores sabios de la Antigüedad, y el héroe mitológico Ulises, hasta Karl Popper, filósofo del conocimiento, y el financiero George Soros. 

Tal vez nunca podamos protegernos del todo de los caprichos de la diosa Fortuna pero, tras leer ¿Existe la Suerte?, estaremos bastante más preparados para sortearlos.


CITAS


"El grado de resistencia al azar en la vida de uno es una idea abstracta, parte de su lógica es contra-intuitiva y, para hacer las cosas todavía más confusas, sus realizaciones no son observables."
Pág. 78

"Los psicólogos llaman a esta sobreestimación de lo que uno sabía en el momento en que se produjo el acontecimiento, debido a la información posterior, el sesgo de la retrospectiva, el efecto de lo supe todo el tiempo"
Pág. 106

"Al igual que Pascal, afirmaré el siguiente argumento. Si la ciencia de la estadística me puede beneficiar en algo, la utilizaré. Si  plantea una amenaza, no la utilizaré. Quiero aprovechar lo mejor que me pueda ofrecer el pasado sin sus peligros. Por lo tanto, utilizaré la estadística de los métodos inductivos para hacer apuestas agresivas, pero no las utilizaré para gestionar mis riesgos y mi exposición. Sorprendentemente, todos los operadores supervivientes que conozco parecen haber hecho lo mismo. Hacen transacciones en función de ideas que parten de cierta observación (que incluyen la historia pasada), pero, al igual que los científicos popperianos, se aseguran de que el coste de equivocarse sea limitado (y de que su probabilidad no dependa de los datos pasados)".
Pág. 176


"...debemos recordar que el hacerse rico es un acto de mero egoísmo, no un acto social. La virtud del capitalismo es que la sociedad se aprovecha de la avaricia de la gente, más que de su benevolencia, pero no hay ninguna necesidad de, además, encomiar esa avaricia como un logro moral (o intelectual)."
Pág. 190


"..., las reglas tienen un valor.. Las aplicamos, no porque sean las mejores, sino porque resultan útiles y ahorran tiempo y esfuerzos. Tenga en cuenta que los que se pusieron a teorizar al ver, por primera vez, a un tigre, sobres si el tigre pertenecía a esta taxonomía o a aquella, y sobre el grado de peligro que entrañaba, terminaron devorados por el tigre. Los que, simplemente, se fueron corriendo a la más mínima presunción y no quedaron rezagados por la más mínima actividad de pensamiento terminaron escapando del tigre o liberándose del primo que había sido devorado por el tigre".
Pág. 233


"Últimamente han proliferado los estudios sobre la dinámica de las redes. Se hicieron populares con el libro de Malcolm Gladwell, El punto de derrame, en el que demuestra que el comportamiento de variables, como las epidemias, pasa a un nivel extremo de contagio cuando se supera determinado nivel crítico no especificado. (Como, por ejemplo, la utilización de zapatillas deportivas por los adolescentes urbanos, o la difusión de ideas religiosas. Las ventas de libros tienen un efecto parecido, explotando una vez que superan un nivel significativo de publicidad por el boca a boca)
Pág. 225


"... la gente sobrevalora su conocimiento y subestima la probabilidad de equivocarse".
Pág. 257


"...la probabilidad no trata de posibilidades, sino sobre la creencia de la existencia de un resultado, causa o motivo alternativo. Recuerde que las matemáticas son un herramienta para reflexionar, no para calcular."
Pág. 281


"El comportamiento de los científicos, cuando afrontan la refutación de sus ideas, ha sido estudiado en profundidad como parte del denominado sesgo de atribución. Uno atribuye sus éxitos a sus propias habilidades, pero sus fallos al azar".
Pág. 290

martes, 22 de diciembre de 2009

El salto del tigre. Las matemáticas de la vida cotidiana


El salto del tigre. Las matemáticas de la vida cotidiana  el autor es John D. Barrow, catedrático de investigación de Ciencias Matemáticas en el Departamento de Matemáticas Aplicadas y Física Teórica de la Universidad de Cambridge.

Libro interesante y entretenido para todos los que nos gustan las matemáticas y aquellos que tengan espíriutu curioso y "aventurero".

Está formado por 100 capítulos, a cada uno de ellos no le dedica más de dos o tres páginas. Son independientes y se pueden leer en el orden que queramos, los temas son muy variados y van desde las bicicletas con ruedas cuadradas, repartos en caso de divorcio, empaquetar objetos en una caja, elección de la cola más rápida, apuestas deportiva, el propio salto del tigre que es el título del libro y un largo número de temas. De estos cien temas podemos destacar los siguientes:

  • 10. ¡Al fin de cuentas, el mundo si es un pañuelo!, donde nos muestra la teoría de los seis grados de separacion, según la cual se puede conocer a cualquier persona del mundo en tan sólo seis pasos.
  • 28. ¿Existen records?, sobre como determinar un hecho como record, en sucesos que se repiten en el tiempo. "Los récords son muy raros cuando los acontecimientos se producen de forma aleatoria".
  • 30. ¡No me lo creo!, sobre cual es a mejor elección en un concurso en el que nos ofrecen tres sobres y el premio está en uno de ellos, y posteriormente el presentador descarta uno de los no elegidos y nos permite o bien mantenernos en la elección primera o cambiar.
  • 32. El problema del Secretario, cómo elegir entre un número de candidatos el autor nos dice "estratégia óptima es ver a un 11/24 de los candidatos y elegir al siguiente que sea mejor de todos ellos y después no ver a nadie más". Esto tendrá como resultado que elegimos al mejor candidato para el trabajo con una probabilidad del 37.1%.
  • 38. ¿Tienes cambio?, donde nos presenta el problema de cuantas tipos de monedas deben de tener un sistema monetario para poder realizar todos los cambios posibles con el mínimo número de monedas.
  • 42. Código secretos de bolsillo, con la cantidad de números que manejamos en nuestra vida moderna, NIF, código SS.SS, números de las cuentas bancarias, debemos buscar códigos de verificación para evitar cunfusiones y errores. En este tema se centra en el número de 16 dígitos de las tarjetas de créditos y nos muestra el algoritmo matemático para comprobar que no es erróneo.
  • 45. Vehículos en la carretera, trata de los estudios sobre la dinámica de las multitudes y de los vehículos, para evitar avalanchas y retenciones.
En tratamiento no es muy exhaustivo por lo que es muy atractivo para aquellos que se quieran adentrar en el mundo de las matemáticas y se hagan una idea de la gran variedad de temática que abarca, en aquellos temas que el autor considera se amplia con unos apéndices con el desarrollo matemáticos. Con los múltiples ejemplos vemos que las matemáticas no es algo ajeno y alejado sino que está presente en multiples problemas que se nos plantean en nuestra vida cotidiana.

Reseña


"Las matemáticas -nos dice el profesor Barrow, director del Millennium Mathematics Project de la Universidad de Cambridge- nos dicen cosas sobre el mundo que no se pueden aprender de ningún otro modo". Nos lo demuestra con este libro, gozoso y divertido, en el que responde a un centenar de preguntas esenciales para nuestro conocimiento de la vida que van del caos al infinito y pasan por "todo lo que hay en medio": la teoría de juegos, la contabilidad "creativa", las apuestas deportivas, los divorcios, las obras de Shakespeare, el salto del tigre o las bicicletas con ruedas cuadradas.


"Si la gente no cree que las matemáticas son sencillas, es sólo porque no se da cuenta de lo complicada que es la vida"

John von Neumann