|
COMPRENSION Y USO DE LA
ESTADÍSTICA
Fernando Valdes - Universidad Romulo Gallegos (Robert Ponterio - Project Director and HTML) SUNY Cortland Department of Modern Languages GLOSARIO
|
Al Azar o Aleatorio:
randomness, random;
le hasard, aléatoire
Son todos aquellos eventos fortuitos o productos de la suerte.
Aleatoriamente:
randomly;
au hasard
Actividades o métodos producidos o llevados a cabo simulando
un comportamiento al azar.
Subdivisión de escala de datos.
Correlación:
correlation;
la corrélation
Cuando dos fenómenos sociales, físicos o biológicos
crecen o decrecen de forma simultánea y proporcional debido a factores
externos, se dice que los fenómenos están positivamente correlacionados.
Si uno crece en la misma proporción que el otro decrece, los dos
fenómenos están negativamente correlacionados. El grado de
correlación se calcula aplicando un coeficiente
de correlación a los datos de ambos fenómenos.
Una correlación positiva perfecta tiene un coeficiente
+ 1, y para una correlación negativa perfecta es -1. La ausencia
de correlación da como coeficiente
0. Por ejemplo, el coeficiente 0,89 indica una correlación positiva
grande, -0,76 es una correlación negativa grande y 0,13 es una correlación
positiva pequeña. (Correlación)
Cuartiles, Deciles
y Percentiles:
quartile, decile, percentile;
le quartile, le décile, le centile/percentile
Si un conjunto de datos está ordenado por magnitud,el valor central (o la media de los dos centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro partes iguales. Esos valores denotados Q1, Q2, y Q3, se llaman primer cuartíl, segundo cuartíl y tercer cuartíl, respectivamente. EL Q2 coincide con la mediana.
Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se le denotan D1, D2,...,D9, mientras que los valores que lodividen en 100 partes iguales se llaman percentiles, denotados por P1, P2,...,P99. El 5º decil y el 50º percentil coinciden con la mediana. Los 25º y 75º percentiles coinciden con el primer y tercer cuartiles.
Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles.
Curva Normal:
normal, Bell curve;
la courbe Laplace-Gauss, normale
La forma prevista de la distribución
normal.
Son los valores cualitativos o cuantitativos mediante los cuales se
miden las características de los objetos, sucesos o fenómenos
a estudiar.
Desviación:
deviation;
l'écart
Diferencia entre un valor y otro valor medio o típico.
(Desviación
Media)
Desviación
Típica:
standard deviation;
l'écart type
La desviación de un elemento del conjunto es su diferencia con respecto a la medida; por ejemplo, en sucesión x1, x2, ..., xn la desviación de x1 es x1-x, y el cuadrado de la desviación es (x1- x )2. La varianza es la medida del cuadro de las desviaciones. Por último, la desviación típica , representada por la letra griega sigma (s), es la raíz cuadrada de la varianza, y se calcula de la siguiente manera:

Si la desviación típica es pequeña, los datos están agrupados cerca de la media; si es grande, están muy dispersos.
Es una mediada de dispersión expresada por el espacio de la
curva
normal comprendido entre la media y +/- s
.
Entrevista y Encuesta:
interview, survey, poll;
une entrevue (interviewer), une enquête, un sondage
Son métodos de recolección de datos,
la entrevista es una serie de preguntas realizadas personalmente y la encuesta
es llevada a cabo generalmente a través de algun formulario que
la persona debe llenar.
Estadística:
statistics;
les statistiques
La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis.
En un sentido menos amplio, el término estadística se
usa para denotar los propios datos, o número
derivados de ellos, tales como los promedios. Así
se habla de estadística de empleo, estadística de accidentes.
Estadístico:
statistic;
une statistique
(un statisticien)
Unidad de medida referente a la muestra. Se
le llama estadístico también a la persona que trabaja con
la estadística.
Frecuencia:
frequency;
la fréquence
Número de veces en que se repite un dato.
Frecuencia Acumulada:
cumulative frequency;
fréquence cumulée
Es el número de estudiantes con calificaciones iguales o menores
que el rango de cada intérvalo
sucesivo. (Frecuencia)
Frecuencia Relativa:
relative frequency;
fréquence relative
Es la proporción entre la frecuencia
de un intérvalo y el número total
de datos.
Histograma:
histogram;
un histogramme
Es una serie de rectángulos con bases iguales al rango
de los intérvalos y con área proporcional
a sus frecuencias.
Es emitir juicios o conclusiones basados en algún conocimiento
o experiencia sobre un evento o suceso.
Inferencia Estadística:
statistical inference;
une inférence statistique
Es aplicar resultados de estudios de una muestra a la poblaciones y emitir juicios o conclusiones sobre esa población en general. (Estadística)
Ejemplo:
Estudio: Causas de la deserción estudiantil en la Universidad
Rómulo Gallegos.
Población: 4000 alumnos.
Muestra: 10% de la población.
Resultados del Estudio de la Muestra: La situación económica,
dificultad en el aprendizaje.
Conclusiones: Se puede inferir
que las causas de deserción de los alumnos de la Universidad Rómulo
Gallegos son la situación económica y la dificultad en el
aprendizaje
Intérvalo de
Clase: class
interval;
un intervalle
de classe
Pequeña sección de la escala según la cual se agrupan
las puntuaciones de una distribución de frecuencia.
Tamaño
o rango de la
Clase.
Límites del Intérvalo:
interval limits;
limites
de l'intervalle
Son los valores extremos que tiene el intérvalo
de clase, inferior y superior, entre los cuales van
a estar los valores de los datos agrupados en ese
intérvalo
de clase.
Media Aritmética:
arithmetic mean;
la
moyenne arithmétique
La media de un conjunto de N números, X1, X2, X3, .. XN. Se define por:

(Propiedades de la Media Aritmética)
(Relación Empírica entre
Media, Mediana y Moda)
(Media Armónica
H)
(Media Geométrica
G)
(Relación
entre las Medias Aritmética, Geométrica y Armónica)
Media Aritmética
Ponderada:
weighted arithmetic mean;
la moyenne arithmétique pondérée
A veces asociamos con los números X1, X2, X3, .. Xk ciertos factores peso (o pesos) W1, W2, W3, .. WK dependientes de la relevancia asignada a cada nímero. En tal caso,

Se llama la media aritmética ponderada con pesos f1, f2, ..., fk.
Ejemplo: Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en los dos parciales, la calificación media es:
![]()
Propiedades de la Media
Aritmética
SI f1 números
tienen media m1, f2 números
tiene m2,...,fk números tienen media
mk, entonces la media de todos los
números es,
Es decir, una media aritmética ponderada de todas las medias.
![]() |
![]() |
|
|
|
La mediana de un conjunto de números ordenados en magnitud es
o el valor central o la media de los dos valores centrales.

Geométricamente la mediana es el valor de X (abscisa)
que corresponde a la recta vertical que divide un histograma
en dos partes de igual área. Ese valor de X se suele denotar por
.
(Relación Empírica entre Media,
Mediana y Moda)
Medidas de la Dispersión:
measures of dispersion;
measures de dispersion
Normalmente la estadística también
se ocupa de la dispersión de la distribución, es decir, si
los datos aparecen sobre todo alrededor de la media
o si están distribuidos por todo el rango.
Una medida de la dispersión es la diferencia entre dos percentiles,
por lo general entre el 25 y el 75. El percentil r
es un número tal que un r por ciento
de los datos son menores o iguales que r
. En particular, los percentiles 25 y 75 se denominan cuartiles
inferior y superior respectivamente. La desviación
típica es otra medida de la dispersión, pero más
útil que los percentiles, pues está definida en términos
aritméticos como se explica a continuación.
Medidas de Tendencia
Central: measures
of central tendency;
les mesures de tendance centrale
Un promedio es un valor típico o representativo de un conjunto de datos. tales valores suelen situarse hacia al centro del conjunto de datos ordenados por magnitud.
Una vez que los datos han sido reunidos y tabulados, comienza el análisis con el objeto de calcular un número único, que represente o resuma todos los datos. Dado que por lo general la frecuencia de los intérvalos centrales es mayor que el resto, este número se suele denominar valor o medida de la tendencia central.

Sean X1,X2,...,Xn los datos
de un estudio estadístico. El valor utilizado
mas a menudo es la media aritmética
o promedio aritmético que se escribe X ,
y que es igual a la suma de todos los valores dividida por n.
El símbolo å 1 o sumatorio, denota la suma de todos los datos. Si las X se agrupan en K intérvalos, con puntos medios m1,m2,..., mk y frecuencias f1,f2,...,fk, la media aritmética viene dada por:
donde i=1,2,...,k.
La mediana y la moda son otros
dos valores de la tendencia central. Si las x se ordenan según sus
valores numéricos, si n es impar la mediana
es la x que ocupa la posición central y si n es par la mediana
es la media o promedio de las dos x centrales.
La moda es la x que aparece con mayor frecuencia.
Si dos o más x aparecen con igual máxima frecuencia,
se dice que el conjunto de las x no tiene moda, o es
bimodal, siendo la moda las dos x que aparecen con más frecuencia,
o es trimodal, con modas las tres x más frecuentes.
Relación Empírica entre
Media,
Mediana
y Moda
mean, median, mode;
la moyenne, la médiane, le mode
Para curvas de frecuencia unimodales que sean poco asimétricas tenemos la siguiente relación empírica
Media – Moda = 3(media- mediana)
Posiciones relativas de la media, la mediana y la moda para curvas de frecuencia asimétrica a derecha e izquierda, respectivamente, para curvas simétricas los tres valores coinciden.
Es el valor que ocurre con mayor frecuencia;
es decir, el valor más frecuente. La moda puede no existir, e incluso
no ser única en caso de existir.
En el caso de datos agrupados donde se haya construido
una curva de frecuencias para ajustar los datos,
la moda será el valor (o valores) de X correspondiente al máximo
(o máximos) de la curva. Ese valor de X se denota por
.
La moda puede deducirse de una distribución de frecuencias
o de un histograma a partir de la fórmula:

(Relación Empírica entre
Media,
Mediana y Moda)
Observación
de Campo:
field observation;
enquête sur le terrain
Es la observación que realiza el investigador en el lugar donde
ocurren los sucesos o eventos, para extraer los datos.
Población y
Muestra: population
& sample;
la population
& un échantillon
Al recoger datos relativos a las características de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fábrica, suele ser imposible o nada práctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra.
Una población puede ser finita o infinita. Por ejemplo, la población consistente en todas las tuercas producidas por una fábrica un cierto día es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita.
Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre las poblaciones a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones.
La parte de la estadística que sólo
se ocupa de describir y analizar un grupo dado, sin sacar conclusiones
sobre un grupo mayor, se llama estadística
descriptiva o deductiva.
Polígono de
frecuencia:
frequency polygon;
le polygone des fréquences
Se obtiene conectando los puntos medios de cada intérvalo
de un histograma de frecuencias
acumuladas con segmentos rectilíneos.
Porcentaje:
percentage;
le pourcentage
Es la proporción de una cantidad de datos
específicos, con respecto al total de esos datos.
Probabilidad:
probability;
la probabilité
Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a través de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 y uno que ocurra con certeza es de 1.
Ejemplo: Cuando se lanza una moneda, se desea saber cual es la
probabilidad de que se sello o cara, es decir existe un 0,5 (50%) de que
sea cara o 0,5 (50%) de que sea sello.
Es una medida que caracteriza un grupo de datos
bajo algún criterio. Como: la media
aritmética y la media
ponderada.
Situación de un dato respecto de una distribución.
Tamaño de la Muestra:
sample size;
la taille
de l'échantillon
Es la cantidad de datos que serán extraidos
de la población para formar parte de la
muestra.
Validez:
validity;
la validité
Importancia predictiva para los propósitos que se persiguen.
(Validez)
Project developed under the LxC Select Languages Across the Curriculum grant from FIPSE. Additional funding provided by SUNY Office of Educational Technology Languages Across the Curriculum Multimedia Development Project.
W3 page maintained by.
Copyright © 1998, 2010 Robert Ponterio, Fernando Valdes