miércoles, 8 de junio de 2016

Unidad 1 "Conceptos básicos de estadística dinámica"



UNIDAD 1. CONCEPTOS BÁSICOS DE ESTADÍSTCA DINÁMICA
1.1. Introducción a la Estadística
1.1.1.                 Concepto de estadística y su utilidad
1.1.2.                 Clasificación de la estadística
1.1.3.                 Áreas de aplicación de la estadística
1.2. Conceptos fundamentales
1.2.1.                 Población y muestra
1.2.2.                 Variables y su clasificación
1.2.3.                 Fuentes de adquisición de datos
1.2.4.                 Selección de la muestra de una población
1.3. Representación de datos
1.3.1.                 Representación tubular de datos
1.3.2.                 Distribución o tabla de frecuencia simple
1.3.3.                 Representación grafica (grafica de barras)


1.1. Introducción a la Estadística 

1.1.1.                 Concepto de estadística y su utilidad
La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas de negocios e instituciones gubernamentales.
Durante el siglo XX, la creación de instrumentos precisos para asuntos de salud pública (epidemiología, bioestadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales en las practicas estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras áreas. La estadística es entendida generalmente no como un sub-área de las matemáticas sino como una ciencia diferente “aliada”. Muchas universidades tienen departamentos académicos de matemáticas y estadística separadamente. La estadística se enseña en departamentos tan diversos como psicología, educación y salud pública.
Regresión lineal - Gráficos de dispersión en estadística
Al aplicar la estadística a un problema científico, industrial o social, se comienza con un proceso o población a ser estudiado. Esta puede ser la población de un país, de granos cristalizados en una roca o de bienes manufacturados por una fábrica en particular durante un periodo dado. También podría ser un proceso observado en varios instantes y los datos recogidos de esta manera constituyen una serie de tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia.


1.1.2.                 Clasificación de la estadística
El estudio de la estadística se divide clásicamente en dos, la estadística descriptiva y la estadística inferencial.
La estadística inferencial o inductiva  sirve extrapolar los resultados obtenidos en el análisis  de los datos y a partir de ello predecir acerca de la  población, con un margen de confianza conocido.

La estadística descriptiva o deductiva se construye a partir de los datos y la inferencia  sobre la población no se puede realizar, al menos con una confianza determinada, la representación de la información obtenida de los datos se representa mediante el uso de unos cuantos parámetros y algunas graficas planteadas de tal forma que den importancia los mismos datos.

1.1.3.                 Áreas de aplicación de la estadística

La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla




La estadística aplicada se apoya totalmente en la utilización de paquetes estadísticos que ayudan a resolver problemas de índole estadística, acortando dramáticamente los tiempos de resolución. Es por esto que en muchas facultades se enseña a utilizar estos programas estadísticos sin que, a veces, el alumno entienda, ni tenga la necesidad de entender cómo funcionan.
• EN LA EDUCACIÓN 
Para el alumno: En el programa de educación al alumno se le capacita para aplicar propiedades o para resolver algunos ejercicios; la problemática de esto es que pierde la noción de la relación entre esa teoría y su realidad social.
 La estadística permite abordar situaciones reales en las que la variabilidad del entorno del estudiante es parte de su realidad Mediante el uso de la estadística, aun en su forma más simple, el educando puede aprender a compilar, analizar y usar datos determinados para resolver problemas y entender la información que recibe del mundo que le rodea.
Para el educador: Cuando un educador realiza un plan de trabajo, planifica actividades, evalúa resultados o realiza cualquier otro aspecto relacionado con su profesión debe basarse en la planificación sin importar el nivel que esta tenga. Las estadísticas le proporcionan la base necesaria a esta planificación para tomar decisiones acertadas en cuanto al logro de estrategias, cumplimiento de metas y objetivos.

•  EN LA SALUD: conocimiento en el manejo de las metodologías del análisis demográfico y de la estadística aplicada a los estudios de población, así como de las distintas fuentes de información socio demográfica que existen para apoyar el estudio de los diferentes fenómenos.

• EN LA MEDICINA : Imprescindible la Estadística, probando nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar un grupo de pacientes tratados con estas técnicas).

• EN LA GENÉTICA: Estudia la probabilidad de obtener ciertos factores hereditarios.
En general se utiliza en todos los campos donde se deban recolectar datos para detener conclusiones que es en particular una rama de la estadística denominada estadística inferencia.





• EN LA CIENCIAS PURAS: sirve para encontrar correlaciones entre las variables, lo que se denomina la teoría de la regresión. Es decir si tomas datos, por ejemplo de temperatura, contra tiempo, podrías escribir una función que las relacione ( o aceptar la hipótesis de que una función las correlaciona)


• EN LAS CIENCIAS SOCIALES: se utiliza para determinar muchos factores como la esperanza de vida, nivel económico, número de hijos, y poder así relacionar los problemas sociales con posibles causas y proporcionar soluciones ( los famosos censos)

• EN LA INVESTIGACION BIOMEDICA: Si los datos que se van a investigar se pueden contar, son par métricos y se recomienda una inicial como T de estudiante.Las pruebas no para métricas solo se cuentan, están o no están en estos casos, se usa la letra CH cuadrada, otro ejemplo son los microorganismos que son o no son resistentes a un antibiótico, están o no están presentes en un grupo de pacientes.


• EN EL CAMPO INDUSTRIAL: Se usa como control de calidad, para ver el promedio y la desviación estándar de pesos, grosores, humedad, etc.


• EN LAS CIENCIAS NATURALES: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.


• EN LAS CIENCIAS SOCIALES Y ECONÓMICAS: es un pilar básico del desarrollo de la demografía y la sociología aplicada.


• PSICOLOGÍA: Es importante para los psicólogos ya que ellos tratan de extraer y resumir información útil de las observaciones que hacen, los psicólogos deben basar sus decisiones en datos limitados y estas son más fáciles de tomar con la ayuda de la estadística, ya que le da mayor claridad y precisión al pensamiento y la investigación psicológica.



1.2 CONCEPTOS FUNDAMENTALES
1.2.1 POBLACIÓN Y MUESTRA 
Una vez definidas las variables a estudiar tenemos que establecer cuál será la población a investigar. En algunos casos se trabaja con toda unapoblación que es el conjunto formado por todos los elementos a estudiar, el cual puede llamarse conjunto completo.
Otras veces no es posible trabajar con toda la población. Supongamos que debemos estudiar la altura de los niños que cumplen 10 años en el presente año. Nos damos cuenta que no podemos hacerlo con todos los cientos de miles de niños que cumplen 10 años en el país, lo que sería toda la población o conjunto completo. Podemos hacerlo con un grupo que sea manejable. O sea que vamos a usar una muestra. Queremos que esa muestra sea una buena representación de todo el conjunto. No podemos quedarnos con los más altos, porque en ese caso estaríamos deformando los resultados. Tampoco con los más bajos, ni siquiera con los que están en el medio. Tienen que estar todos mezclados.
Podemos ver que hacer un muestreo tiene varias dificultades. Hay que buscar una muestra que no le de preferencia a ninguna de las cualidades a estudiar. Tiene que ser lo más heterogénea posible, pensando siempre que sea una representación en pequeño de toda la población.
Por lo tanto un muestreo consiste justamente en tomar una parte de un conjunto, estudiar una de sus características y tratar de analizar si con cuidado podemos extender los resultados y conclusiones a todo el conjunto, a toda la población estudiada.
POBLACIÓN O CONJUNTO COMPLETO:
Conjunto formado por todos los elementos a estudiar.
MUESTRA:
Parte de una población que se considera representativa de la misma.
MUESTREO:
Acción de escoger muestras representativas.


1.2.2 VARIABLES Y SU CLASIFICACIÓN
Las variables pueden ser de dos tipos: cualitativas y cuantitativas.

Variables Cualitativas: Son aquellas que no se pueden medir numéricamente ejemplo: nacionalidad, color de la piel, sexo.

Variables Cuantitativas: Son aquellas que tienen valor numérico (edad, precio de un producto, ingresos anuales).





A su vez, las variables cuantitativas  pueden ser: discretas y continuas.

Discretas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.).


Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45)

Continuas: Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.

1.2.3 FUENTES DE ADQUISICIÓN DE DATOS

La adquisición de datos o adquisición de señales, consiste en la toma de muestras del mundo real (sistema analógico) para generar datos que puedan ser manipulados por un ordenador u otras electrónicas (sistema digital). Consiste, en tomar un conjunto de señales físicas, convertirlas en tensiones eléctricas y digitalizarlas de manera que se puedan procesar en una computadora o PAC. Se requiere una etapa de acondicionamiento, que adecua la señal a niveles compatibles con el elemento que hace la transformación a señal digital.



 El elemento que hace dicha transformación es el módulo de digitalización o tarjeta de Adquisición de Datos (DAQ).
La adquisición de datos se inicia con el fenómeno físico o la propiedad física de un objeto (objeto de la investigación) que se desea medir. Esta propiedad física o fenómeno podría ser el cambio de temperatura o la temperatura de una habitación, la intensidad o intensidad del cambio de una fuente de luz, la presión dentro de una cámara, la fuerza aplicada a un objeto, o muchas otras cosas. Un eficaz sistema de adquisición de datos pueden medir todos estos diferentes propiedades o fenómenos.



Un sensor es un dispositivo que convierte una propiedad física o fenómeno en una señal eléctrica correspondiente medible, tal como tensión, corriente, el cambio en los valores de resistencia o condensador, etc. La capacidad de un sistema de adquisición de datos para medir los distintos fenómenos depende de los transductores para convertir las señales de los fenómenos físicos mensurables en la adquisición de datos por hardware. Transductores son sinónimo de sensores en sistemas de DAQ. Hay transductores específicos para diferentes aplicaciones, como la medición de la temperatura, la presión, o flujo de fluidos. DAQ también despliega diversas técnicas de acondicionamiento de Señales para modificar adecuadamente diferentes señales eléctricas en tensión, que luego pueden ser digitalizados usando CED.
Las señales pueden ser digitales (también llamada señales de la lógica) o analógicas en función del transductor utilizado.
El acondicionamiento de señales suele ser necesario si la señal desde el transductor no es adecuado para la DAQ hardware que se utiliza. La señal puede ser amplificada o desamplificada, o puede requerir de filtrado, o un cierre patronal, en el amplificador se incluye para realizar demodulación. Varios otros ejemplos de acondicionamiento de señales podría ser el puente de conclusión, la prestación actual de tensión o excitación al sensor, el aislamiento, linealización, etc.

Ejemplos de Sistemas de Adquisición y control: · DAQ para recoger datos(datalogger) medioambientales (energías renovables e ingeniería verde). · DAQ para audio y vibraciones (mantenimiento, test). · DAQ + control de movimiento(corte con laser). · DAQ + control de movimiento+ visión artificial (robots modernos).




1.2.4 SELECCIÓN DE LA MUESTRA DE UNA POBLACIÓN 

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

 





1.3. Representación de datos
1.3.1.                 Representación tubular de datos
1.3.2.                 Distribución o tabla de frecuencia simple
1.3.3.                 Representación grafica (grafica de barras)

La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los aspectos de mas uso en la estadística descriptiva. A partir podemos visualizar a través de los diferentes medios escritos y televisivos de comunicación masiva la presentación de los datos estadísticos sobre el comportamiento de las principales variables económicas y sociales, nacionales e internacionales.
1-Presentación escrita: Esta forma de presentación de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.
2-Presentación tabular: Cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma más exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes:
Título: Es la parte más importante del cuadro y sirve para describir todo el contenido de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
3-Presentación gráfica: Proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una gráfica es una expresión artística usada para representar un conjunto de datos.
De acuerdo al tipo de variable que vamos a representar, las principales graficas son las siguientes:
Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón de que lo utilizamos para representar variables continuas.
Polígono de frecuencias: Esta grafica se usa para representar los puntos medios de clase en una distribución de frecuencias
Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la otra, en razón de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.
Gráfica lineal: Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar las partes en que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas de una distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre la base "menor que" o sobre la base "o más". Puede determinar el valor de la mediana de la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de presentación de datos, sin abordar su otra faceta como herramienta de análisis.

 



 

 

 

DISTRIBUCIÓN DE FRECUENCIA

Gráficos estadísticos
Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.




Gráficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.
·                     para una serie
Monografias.com
·                     para dos o más series
Gráficos de barras proporcionales
Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser:
Verticales
Horizontales


Gráficos de barras comparativas: Se utilizan para Amparar dos o más series, para comparar valores entre categorías barras pueden ser: Verticales Horizontales
Gráficos de barras e usan para mostrar las relaciones entre dos o más series con el total. Las barras pueden ser: verticales horizontales
Gráficos de líneas
En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar: una serie dos o más series

Una presentación adecuada y clara de los resultados de un trabajo de investigación además de ser fundamental para contribuir a la difusión de los mismos, puede incluso ser imprescindible para lograr que se acepte su publicación. En la actualidad la exigencia de las revistas y de los revisores ha contribuido a que el nivel de calidad en la presentación de datos sea bastante bueno, por lo que es conveniente tener algunas ideas muy claras para evitar errores o situaciones que hoy ya no son admisibles, lo que no solo nos preparará para la publicación de nuestros trabajos sino también para una lectura crítica de los de otros. Precisamente un buen punto de partida para obtener información, no sólo sobre cómo presentar nuestros resultados sino también sobre cómo preparar todo el conjunto del artículo, lo constituyen las propias guías suministradas por las revistas.
Un artículo bien concebido debe transmitir la mayor parte de la información con sólo leer el Abstracta y los Resultados, siendo para ello vital que los datos, con las tablas y figuras correspondientes, estén bien presentados y organizados. En general no debiera ser necesario acudir al texto para entender una tabla o una figura; otro caso es para interpretarla, lo que ya corresponde al apartado de Discusión o Conclusiones.






La manera de presentar los datos es diferente según el tipo de los mismos. De forma rápida podemos hacer dos grandes grupos: datos cuantitativos y datos cualitativos. En el grupo de datos cuantitativos tenemos aquellos cuyo resultado puede variar de forma continua, como puede ser el peso, la edad, etc. y los que sólo pueden tomar valores enteros como por ejemplo el número de hijos, el número de ingresados en la Unidad de Quemados un día concreto, etc. A su vez en las variables cualitativas distinguiremos las nominales, que constituyen una simple etiqueta -como puede ser el sexo, el grupo sanguíneo, etc.- de las ordinales, en las que se da una relación de orden entre las respuestas, como por ejemplo en el resultado de una patología/tratamiento (fallece, empeora, sin cambios, mejora, curación) o el nivel educacional. Cada tipo variable tiene requerimientos propios en cuanto a presentación y en cuanto a las pruebas que se utilizan para contrastar los valores entre diferentes grupos.
Observados en ella serán válidos aproximadamente para esa población, y los procedimientos estadísticos nos permiten cuantificar la magnitud del término "aproximadamente", lo que dependerá del tamaño y representatividad de la muestra (error de muestreo), la variación debida a las técnicas de medida empleadas (error de medida), y la propia variabilidad del proceso estudiado (error aleatorio).
La precisión de la estimación efectuada a partir de los datos del estudio se refleja en el intervalo de confianza. El intervalo de confianza de un parámetro viene dado por dos límites, inferior y superior, en el que, de acuerdo con nuestros datos, esperamos que se encuentre el valor verdadero del parámetro de la población (desconocido), con un nivel de seguridad determinado y que se suele fijar en el 95%.
El intervalo de confianza es mucho más informativo que indicar solo si un resultado ha sido estadísticamente significativo, incluso aunque se dé el valor de la probabilidad









EJERCICIOS








 PROBLEMAS
Un grupo de la epo 51 se obtuvieron los siguientes resultados durante el semestre anterior en la materia de probabilidad y estadística dinámica, 5 alumnos obtuvieron 5, 12 alumnos obtuvieron 6, 15 obtuvieron 7, 10 obtuvieron 8, 3 obtuvieron 9 y 3 obtuvieron 10.
A)     Completa la siguientes tablas
No. De alumnos
Calificación
5
5
12
6
15
7
10
8
3
9
3
10

% de alumnos
calificación
10.4166
5
25
6
31.25
7
20.83
8
6.25
9
6.25
10

48 alumnos        100  %
5 alumnos                   = %                                                            

No hay comentarios:

Publicar un comentario