UNIDAD 1. CONCEPTOS BÁSICOS DE ESTADÍSTCA DINÁMICA
1.1. Introducción
a la Estadística
1.1.1. Concepto
de estadística y su utilidad
1.1.2. Clasificación
de la estadística
1.1.3. Áreas
de aplicación de la estadística
1.2. Conceptos
fundamentales
1.2.1. Población
y muestra
1.2.2. Variables
y su clasificación
1.2.3. Fuentes
de adquisición de datos
1.2.4. Selección
de la muestra de una población
1.3. Representación
de datos
1.3.1. Representación
tubular de datos
1.3.2. Distribución
o tabla de frecuencia simple
1.3.3. Representación
grafica (grafica de barras)
1.1. Introducción a la Estadística
1.1.1. Concepto
de estadística y su utilidad
La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones
válidas y tomar decisiones razonables basadas en tal análisis.
La estadística es una
ciencia con base matemática referente a la recolección, análisis e
interpretación de datos, que busca explicar condiciones regulares en fenómenos
de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde
la física hasta las ciencias sociales, desde las ciencias de la salud hasta el
control de calidad, y es usada para la toma de decisiones en áreas de negocios
e instituciones gubernamentales.
Durante el siglo XX,
la creación de instrumentos precisos para asuntos de salud pública
(epidemiología, bioestadística, etc.) y propósitos económicos y sociales (tasa
de desempleo, econometría, etc.) necesitó de avances sustanciales en las
practicas estadísticas.
Hoy el uso de la
estadística se ha extendido más allá de sus orígenes como un servicio al Estado
o al gobierno. Personas y organizaciones usan la estadística para entender
datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y
otras áreas. La estadística es entendida generalmente no como un sub-área de
las matemáticas sino como una ciencia diferente “aliada”. Muchas universidades
tienen departamentos académicos de matemáticas y estadística separadamente. La
estadística se enseña en departamentos tan diversos como psicología, educación
y salud pública.
Regresión lineal -
Gráficos de dispersión en estadística
Al aplicar la
estadística a un problema científico, industrial o social, se comienza con un
proceso o población a ser estudiado. Esta puede ser la población de un país, de
granos cristalizados en una roca o de bienes manufacturados por una fábrica en
particular durante un periodo dado. También podría ser un proceso observado en
varios instantes y los datos recogidos de esta manera constituyen una serie de
tiempo.
Por razones prácticas,
en lugar de compilar datos de una población entera, usualmente se estudia un
subconjunto seleccionado de la población, llamado muestra. Datos acerca de la
muestra son recogidos de manera observacional o experimental. Los datos son
entonces analizados estadísticamente lo cual sigue dos propósitos: descripción
e inferencia.
1.1.2. Clasificación
de la estadística
El estudio de la estadística se divide
clásicamente en dos, la estadística descriptiva y la estadística inferencial.
La estadística inferencial o
inductiva sirve extrapolar los resultados obtenidos en el análisis de
los datos y a partir de ello predecir acerca de la población, con un
margen de confianza conocido.
La estadística descriptiva o
deductiva se construye a partir
de los datos y la inferencia sobre la población no se puede realizar, al
menos con una confianza determinada, la representación de la información
obtenida de los datos se representa mediante el uso de unos cuantos parámetros
y algunas graficas planteadas de tal forma que den importancia los mismos
datos.
1.1.3. Áreas
de aplicación de la estadística
La Estadística puede dar
respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su
tarea fundamental es la reducción de datos, con el objetivo de representar la
realidad y transformarla, predecir su futuro o simplemente conocerla
La estadística aplicada se
apoya totalmente en la utilización de paquetes estadísticos que ayudan a
resolver problemas de índole estadística, acortando dramáticamente los tiempos
de resolución. Es por esto que en muchas facultades se enseña a utilizar estos
programas estadísticos sin que, a veces, el alumno entienda, ni tenga la
necesidad de entender cómo funcionan.
• EN LA EDUCACIÓN
• EN LA EDUCACIÓN
Para el alumno: En el
programa de educación al alumno se le capacita para aplicar propiedades o para
resolver algunos ejercicios; la problemática de esto es que pierde la noción de
la relación entre esa teoría y su realidad social.
La estadística permite
abordar situaciones reales en las que la variabilidad del entorno del
estudiante es parte de su realidad Mediante el uso de la estadística, aun en su
forma más simple, el educando puede aprender a compilar, analizar y usar datos
determinados para resolver problemas y entender la información que recibe del
mundo que le rodea.
Para el educador: Cuando un
educador realiza un plan de trabajo, planifica actividades, evalúa resultados o
realiza cualquier otro aspecto relacionado con su profesión debe basarse en la
planificación sin importar el nivel que esta tenga. Las estadísticas le
proporcionan la base necesaria a esta planificación para tomar decisiones
acertadas en cuanto al logro de estrategias, cumplimiento de metas y
objetivos.
• EN LA SALUD: conocimiento en el manejo de las metodologías del análisis demográfico y de la estadística aplicada a los estudios de población, así como de las distintas fuentes de información socio demográfica que existen para apoyar el estudio de los diferentes fenómenos.
• EN LA MEDICINA : Imprescindible la Estadística, probando nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar un grupo de pacientes tratados con estas técnicas).
• EN LA GENÉTICA: Estudia la probabilidad de obtener ciertos factores hereditarios.
En general se utiliza en todos los campos donde se deban recolectar datos para detener conclusiones que es en particular una rama de la estadística denominada estadística inferencia.
• EN LA SALUD: conocimiento en el manejo de las metodologías del análisis demográfico y de la estadística aplicada a los estudios de población, así como de las distintas fuentes de información socio demográfica que existen para apoyar el estudio de los diferentes fenómenos.
• EN LA MEDICINA : Imprescindible la Estadística, probando nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar un grupo de pacientes tratados con estas técnicas).
• EN LA GENÉTICA: Estudia la probabilidad de obtener ciertos factores hereditarios.
En general se utiliza en todos los campos donde se deban recolectar datos para detener conclusiones que es en particular una rama de la estadística denominada estadística inferencia.
• EN LA CIENCIAS PURAS: sirve para encontrar correlaciones entre las variables, lo que se denomina la teoría de la regresión. Es decir si tomas datos, por ejemplo de temperatura, contra tiempo, podrías escribir una función que las relacione ( o aceptar la hipótesis de que una función las correlaciona)
• EN LAS CIENCIAS SOCIALES: se utiliza para determinar muchos factores como la esperanza de vida, nivel económico, número de hijos, y poder así relacionar los problemas sociales con posibles causas y proporcionar soluciones ( los famosos censos)
• EN LA INVESTIGACION BIOMEDICA: Si los datos que se van a investigar se pueden contar, son par métricos y se recomienda una inicial como T de estudiante.Las pruebas no para métricas solo se cuentan, están o no están en estos casos, se usa la letra CH cuadrada, otro ejemplo son los microorganismos que son o no son resistentes a un antibiótico, están o no están presentes en un grupo de pacientes.
• EN EL CAMPO INDUSTRIAL: Se usa como control de calidad, para ver el promedio y la desviación estándar de pesos, grosores, humedad, etc.
• EN LAS CIENCIAS NATURALES: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.
• EN LAS CIENCIAS SOCIALES Y ECONÓMICAS: es un pilar básico del desarrollo de la demografía y la sociología aplicada.
• PSICOLOGÍA: Es importante para los psicólogos ya que ellos tratan de extraer y resumir información útil de las observaciones que hacen, los psicólogos deben basar sus decisiones en datos limitados y estas son más fáciles de tomar con la ayuda de la estadística, ya que le da mayor claridad y precisión al pensamiento y la investigación psicológica.
1.2 CONCEPTOS
FUNDAMENTALES
1.2.1 POBLACIÓN Y
MUESTRA
Una vez definidas las variables a estudiar tenemos que
establecer cuál será la población a investigar. En algunos casos se trabaja con
toda unapoblación que es el conjunto formado por todos los elementos a
estudiar, el cual puede llamarse conjunto completo.
Otras veces no es posible trabajar con toda la población.
Supongamos que debemos estudiar la altura de los niños que cumplen 10 años en
el presente año. Nos damos cuenta que no podemos hacerlo con todos los cientos
de miles de niños que cumplen 10 años en el país, lo que sería toda la
población o conjunto completo. Podemos hacerlo con un grupo que sea manejable.
O sea que vamos a usar una muestra. Queremos que esa muestra sea una buena
representación de todo el conjunto. No podemos quedarnos con los más altos,
porque en ese caso estaríamos deformando los resultados. Tampoco con los más
bajos, ni siquiera con los que están en el medio. Tienen que estar todos
mezclados.
Podemos ver que hacer un muestreo tiene varias
dificultades. Hay que buscar una muestra que no le de preferencia a ninguna de
las cualidades a estudiar. Tiene que ser lo más heterogénea posible, pensando
siempre que sea una representación en pequeño de toda la población.
Por lo tanto un muestreo consiste justamente en tomar una parte de un conjunto, estudiar una de sus características y tratar de analizar si con cuidado podemos extender los resultados y conclusiones a todo el conjunto, a toda la población estudiada.
Por lo tanto un muestreo consiste justamente en tomar una parte de un conjunto, estudiar una de sus características y tratar de analizar si con cuidado podemos extender los resultados y conclusiones a todo el conjunto, a toda la población estudiada.
POBLACIÓN O CONJUNTO
COMPLETO:
Conjunto formado por todos
los elementos a estudiar.
|
MUESTRA:
Parte de una población que
se considera representativa de la misma.
MUESTREO:
Acción de escoger muestras
representativas.
|
1.2.2 VARIABLES Y SU CLASIFICACIÓN
Las variables pueden ser de dos tipos: cualitativas y
cuantitativas.
Variables Cualitativas: Son aquellas que no se pueden medir
numéricamente ejemplo: nacionalidad, color de la piel, sexo.
Variables Cuantitativas: Son aquellas que tienen valor numérico
(edad, precio de un producto, ingresos anuales).
A su vez, las variables cuantitativas pueden
ser: discretas y continuas.
Discretas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.).
Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por
ejemplo, nunca podrá ser 3.45)
Continuas: Pueden tomar cualquier valor real dentro de un
intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57
km/h...etc.
1.2.3 FUENTES DE
ADQUISICIÓN DE DATOS
La adquisición de datos o adquisición de señales, consiste en
la toma de muestras del mundo real (sistema analógico) para generar datos que
puedan ser manipulados por un ordenador u otras electrónicas (sistema digital).
Consiste, en tomar un conjunto de señales físicas, convertirlas en tensiones
eléctricas y digitalizarlas de manera que
se puedan procesar en una computadora o PAC. Se requiere una etapa de acondicionamiento, que adecua la señal a
niveles compatibles con el elemento que hace la transformación a señal digital.
El elemento que hace dicha
transformación es el módulo de digitalización o tarjeta de Adquisición de Datos
(DAQ).
La adquisición de datos se inicia con el fenómeno físico o la propiedad
física de un objeto (objeto de la investigación) que se desea medir. Esta
propiedad física o fenómeno podría ser el cambio de temperatura o la
temperatura de una habitación, la intensidad o intensidad del cambio de una
fuente de luz, la presión dentro de una cámara, la fuerza aplicada a un objeto,
o muchas otras cosas. Un eficaz sistema de adquisición de datos pueden medir
todos estos diferentes propiedades o fenómenos.
Un sensor es un
dispositivo que convierte una propiedad física o fenómeno en una señal
eléctrica correspondiente medible, tal como tensión, corriente, el cambio en
los valores de resistencia o condensador, etc. La capacidad de un sistema de
adquisición de datos para medir los distintos fenómenos depende de los
transductores para convertir las señales de los fenómenos físicos mensurables
en la adquisición de datos por hardware. Transductores son sinónimo
de sensores en sistemas de DAQ. Hay transductores específicos para
diferentes aplicaciones, como la medición de la temperatura, la presión, o
flujo de fluidos. DAQ también despliega diversas técnicas de
acondicionamiento de Señales para modificar adecuadamente diferentes señales
eléctricas en tensión, que luego pueden ser digitalizados usando CED.
Las señales pueden ser digitales (también llamada señales de la lógica)
o analógicas en función del transductor utilizado.
El acondicionamiento de señales suele ser necesario si la señal desde el
transductor no es adecuado para la DAQ hardware que se utiliza. La señal puede
ser amplificada o desamplificada, o puede requerir de filtrado, o un cierre
patronal, en el amplificador se incluye para realizar demodulación. Varios otros ejemplos de
acondicionamiento de señales podría ser el puente de conclusión, la prestación
actual de tensión o excitación al sensor, el aislamiento, linealización, etc.
Ejemplos de Sistemas de Adquisición y control: · DAQ para recoger
datos(datalogger) medioambientales (energías renovables e ingeniería verde). ·
DAQ para audio y vibraciones (mantenimiento, test). · DAQ + control de
movimiento(corte con laser). · DAQ + control de movimiento+ visión artificial
(robots modernos).
1.2.4 SELECCIÓN DE
LA MUESTRA DE UNA POBLACIÓN
En estadística se conoce
como muestreo a la técnica para la selección de una muestra a partir de
una población.
Al elegir una muestra se espera conseguir que sus propiedades sean
extrapolables a la población. Este proceso
permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se
alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar
un estudio adecuado (que consienta no solo hacer estimaciones de la población
sino estimar también los márgenes de error correspondientes a dichas
estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar
enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos
actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño
de la población, se puede extraer dos o más muestras de la misma población. Al
conjunto de muestras que se pueden obtener de la población se
denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción, sigue la llamada distribución muestral.
1.3. Representación de datos
1.3.1. Representación
tubular de datos
1.3.2. Distribución
o tabla de frecuencia simple
1.3.3. Representación
grafica (grafica de barras)
La presentación
de datos estadísticos
constituye en sus diferentes modalidades uno de los aspectos de mas uso en
la estadística
descriptiva.
A partir podemos visualizar a través de los diferentes medios escritos y
televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las
principales variables económicas y
sociales, nacionales e internacionales.
1-Presentación
escrita:
Esta forma de presentación de informaciones se usa cuando una serie de datos
incluye pocos valores, por lo cual resulta
más apropiada la palabra escrita como forma de escribir el comportamiento de los
datos; mediante la forma escrita, se resalta la importancia de las
informaciones principales.
2-Presentación
tabular: Cuando
los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico; es de gran eso e importancia
para el uso e importancia para el usuario ya que constituye la forma más exacta
de presentar las informaciones. Una tabla consta de varias partes, las
principales son las siguientes:
Título: Es la parte más
importante del cuadro y sirve para describir todo el contenido de este.
Encabezados: Son los
diferentes subtítulos que se colocan en la parte superior de cada columna.
Cuerpo: El cuerpo
contiene todas las informaciones numéricas que aparecen en la tabla.
Fuente: La fuente de
los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son
usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla
o cuadro y que no han sido explicados en otras partes.
3-Presentación gráfica: Proporciona al lector
o usuario mayor rapidez en la comprensión de los datos, una gráfica es una
expresión artística usada para representar un conjunto de datos.
De acuerdo al tipo de
variable que vamos a representar, las principales graficas son las
siguientes:
Histograma: Es un conjunto de
barras o rectángulos unidos uno de otro, en razón de que lo utilizamos para
representar variables continuas.
Polígono de
frecuencias: Esta grafica se usa para representar los puntos medios de clase en una distribución de frecuencias
Gráfica de
barras: Es
un conjunto de rectángulos o barras separadas una de la otra, en razón de que
se usa para representar variables discretas; las barras deben ser de igual base
o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y
horizontal.
Gráfica lineal: Son usadas
principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para
representar series
de tiempo o
cronológicas.
Gráfica de barra 100%
y gráfica circular: se usan especialmente para representar las partes en que se
divide una cantidad total.
La ojiva: Esta
grafica consiste en la representación de las frecuencias acumuladas de una
distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre
la base "menor que" o sobre la base "o más". Puede
determinar el valor de la mediana
de la distribución.
En estadística denominamos gráficos a
aquellas imágenes que, combinando
la utilización De sombreado, colores, puntos,
líneas, símbolos, números, texto y un sistema De referencia
(coordenadas), permiten presentar información cuantitativa.
La utilidad De los gráficos
es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que
también constituyen por sí mismos una poderosa herramienta para el análisis De los datos,
siendo en ocasiones el medio más efectivo no sólo para describir y resumir la
información, sino también para analizarla.
En este trabajo solo nos vamos
a centrar únicamente en los gráficos como vehículo de presentación de datos,
sin abordar su otra faceta como herramienta de análisis.
DISTRIBUCIÓN DE FRECUENCIA
Gráficos estadísticos
Gráficos de barras
horizontales
Representan valores
discretos a base de trazos horizontales, aislados unos de otros. Se utilizan
cuando los textos correspondientes a cada categoría son muy extensos.
·
para
una serie
Gráficos de barras
proporcionales
Se usan cuando lo que
se busca es resaltar la representación de los porcentajes de los datos
que componen un total. Las barras pueden ser:
Verticales
Horizontales
Gráficos de barras
comparativas: Se
utilizan para Amparar dos o más series, para comparar valores entre categorías
barras pueden ser: Verticales Horizontales
Gráficos de
barras e
usan para mostrar las relaciones entre dos o más series con el total. Las
barras pueden ser: verticales horizontales
Gráficos de líneas
En este tipo de
gráfico se representan los
valores de
los datos en dos ejes
cartesianos ortogonales entre sí. Se pueden usar para representar: una serie
dos o más series
Una presentación
adecuada y clara de los resultados de un trabajo de investigación además de ser
fundamental para contribuir a la difusión de los mismos, puede incluso ser
imprescindible para lograr que se acepte su publicación. En la actualidad la
exigencia de las revistas y de los revisores ha contribuido a que el nivel
de calidad en la
presentación de datos sea bastante bueno, por lo que es conveniente tener
algunas ideas muy claras para evitar errores o situaciones que hoy ya no son
admisibles, lo que no solo nos preparará para la publicación de nuestros trabajos
sino también para una lectura crítica de los de
otros. Precisamente un buen punto de partida para obtener información, no sólo sobre cómo
presentar nuestros resultados sino también sobre cómo preparar todo el conjunto
del artículo, lo constituyen las propias guías suministradas por las revistas.
Un artículo bien
concebido debe transmitir la mayor parte de la información con sólo leer el
Abstracta y los Resultados, siendo para ello vital que los datos, con las
tablas y figuras correspondientes, estén bien presentados y organizados. En
general no debiera ser necesario acudir al texto para entender
una tabla o una figura; otro caso es para interpretarla, lo que ya corresponde
al apartado de Discusión o Conclusiones.
La manera de
presentar los datos es diferente según el tipo de los mismos. De forma rápida
podemos hacer dos grandes grupos: datos cuantitativos
y datos cualitativos. En el grupo de datos
cuantitativos tenemos aquellos cuyo resultado puede variar de forma continua,
como puede ser el peso, la edad, etc. y los que sólo pueden tomar valores
enteros como por ejemplo el número de hijos, el número de ingresados en la
Unidad de Quemados un día concreto, etc. A su vez en
las variables cualitativas
distinguiremos las nominales, que constituyen una simple etiqueta -como puede
ser el sexo, el grupo sanguíneo,
etc.- de las ordinales, en las que se da una relación de orden entre las
respuestas, como por ejemplo en el resultado de una patología/tratamiento
(fallece, empeora, sin cambios, mejora, curación) o el nivel educacional. Cada
tipo variable tiene requerimientos propios en cuanto a presentación y en cuanto
a las pruebas que se utilizan
para contrastar los valores entre diferentes grupos.
Observados en ella
serán válidos aproximadamente para esa población, y los procedimientos estadísticos
nos permiten cuantificar la magnitud del término "aproximadamente",
lo que dependerá del tamaño y representatividad de la muestra (error de muestreo), la variación
debida a las técnicas de medida
empleadas (error de medida), y la propia variabilidad del
proceso estudiado (error aleatorio).
La precisión de la
estimación efectuada a partir de los datos del estudio se refleja en el
intervalo de confianza. El intervalo de confianza de un parámetro viene dado
por dos límites, inferior y
superior, en el que, de acuerdo con nuestros datos, esperamos que se encuentre
el valor verdadero del
parámetro de la población (desconocido), con un nivel de seguridad
determinado y que se suele fijar en el 95%.
El intervalo de
confianza es mucho más informativo que indicar solo si un resultado ha sido
estadísticamente significativo, incluso aunque se dé el valor de la
probabilidad
EJERCICIOS
PROBLEMAS
Un grupo de
la epo 51 se obtuvieron los siguientes resultados durante el semestre anterior
en la materia de probabilidad y estadística dinámica, 5 alumnos obtuvieron 5,
12 alumnos obtuvieron 6, 15 obtuvieron 7, 10 obtuvieron 8, 3 obtuvieron 9 y 3
obtuvieron 10.
A) Completa la siguientes tablas
No. De
alumnos
|
Calificación
|
5
|
5
|
12
|
6
|
15
|
7
|
10
|
8
|
3
|
9
|
3
|
10
|
% de
alumnos
|
calificación
|
10.4166
|
5
|
25
|
6
|
31.25
|
7
|
20.83
|
8
|
6.25
|
9
|
6.25
|
10
|
48 alumnos 100
%
5 alumnos =
%
No hay comentarios:
Publicar un comentario