COMPRENSION Y USO DE LA ESTADÍSTICA

 Fernando Valdes - Universidad Romulo Gallegos
Robert Ponterio - local Project Director, HTML, translations)
SUNY Cortland Department of Modern Languages

GLOSARIO
back


 

Al Azar o Aleatorio: english randomness, random; francais le hasard, aléatoire; Portuguese aleatório

Son todos aquellos eventos fortuitos o productos de la suerte.

 

Aleatoriamente: english randomly; francais au hasard; Portuguese ao acaso

Actividades o métodos producidos o llevados a cabo simulando un comportamiento al azar.

 

Clase: english class; francais la classe; Portuguese a classe

Subdivisión de escala de datos.

 

Correlación: english correlation; francais la corrélation; Portuguese a correlação

Cuando dos fenómenos sociales, físicos o biológicos crecen o decrecen de forma simultánea y proporcional debido a factores externos, se dice que los fenómenos están positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los dos fenómenos están negativamente correlacionados. El grado de correlación se calcula aplicando un coeficiente de correlación a los datos de ambos fenómenos. Una correlación positiva perfecta tiene un coeficiente + 1, y para una correlación negativa perfecta es -1. La ausencia de correlación da como coeficiente 0. Por ejemplo, el coeficiente 0,89 indica una correlación positiva grande, -0,76 es una correlación negativa grande y 0,13 es una correlación positiva pequeña. (Correlación)

 

Cuartiles, Deciles y Percentiles: english quartile, decile, percentile; francais le quartile, le décile, le centile/percentile; Portuguese o quartil, o decil, o percentil

Si un conjunto de datos está ordenado por magnitud,el valor central (o la media de los dos centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro partes iguales. Esos valores denotados Q1, Q2, y Q3, se llaman primer cuartíl, segundo cuartíl y tercer cuartíl, respectivamente. EL Q2 coincide con la mediana.

Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se le denotan D1, D2,...,D9, mientras que los valores que lodividen en 100 partes iguales se llaman percentiles, denotados por P1, P2,...,P99. El 5º decil y el 50º percentil coinciden con la mediana. Los 25º y 75º percentiles coinciden con el primer y tercer cuartiles.

Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles.

 

Curva Normal: english normal, Bell curve; francais la courbe Laplace-Gauss, normale; Portuguese a curva normal

La forma prevista de la distribución normal.

 

Datos: englishdata; francais les données; Portuguese os dados

Son los valores cualitativos o cuantitativos mediante los cuales se miden las características de los objetos, sucesos o fenómenos a estudiar.

 

Desviación: english deviation; francais l'écart; Portuguese o desvio

Diferencia entre un valor y otro valor medio o típico.  (Desviación Media)

 

Desviación Típica: english standard deviation; francais l'écart type; Portuguese o desvio padrão

La desviación de un elemento del conjunto es su diferencia con respecto a la medida; por ejemplo, en sucesión x1, x2, ..., xn la desviación de x1 es x1-x, y el cuadrado de la desviación es (x1- x )2. La varianza es la medida del cuadro de las desviaciones. Por último, la desviación típica , representada por la letra griega sigma (σ), es la raíz cuadrada de la varianza, y se calcula de la siguiente manera:

-

Si la desviación típica es pequeña, los datos están agrupados cerca de la media; si es grande, están muy dispersos.

Es una mediada de dispersión expresada por el espacio de la curva normal comprendido entre la media y +/- σ .

 

Entrevista y Encuesta: english interview, survey, poll; francais une entrevue (interviewer), une enquête, un sondage; Portuguese a sondagem, o inquérito, o levantamento

Son métodos de recolección de datos, la entrevista es una serie de preguntas realizadas personalmente y la encuesta es llevada a cabo generalmente a través de algun formulario que la persona debe llenar.

 

Estadística: english statistics; francais les statistiques; Portuguese a estatística

La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis.

En un sentido menos amplio, el término estadística se usa para denotar los propios datos, o número derivados de ellos, tales como los promedios. Así se habla de estadística de empleo, estadística de accidentes.

 

Estadístico: english statistic (a statisticien); francais une statistique (un statisticien); Portuguese o dado estatístico / a estatística (especialista em estatística)

Unidad de medida referente a la muestra. Se le llama estadístico también a la persona que trabaja con la estadística.

 

Frecuencia: english frequency; francais la fréquence; Portuguese a frequência

Número de veces en que se repite un dato.

 

Frecuencia Acumulada: english cumulative frequency; francais fréquence cumulée; Portuguese a frequência cumulativa/acumulada

Es el número de estudiantes con calificaciones iguales o menores que el rango de cada intérvalo sucesivo.  (Frecuencia)

 

Frecuencia Relativa: english relative frequency; francais fréquence relative; Portuguese a frequência relativa

Es la proporción entre la frecuencia de un intérvalo y el número total de datos.

 

Histograma: english histogram; francais un histogramme; Portuguese um histograma

Es una serie de rectángulos con bases iguales al rango de los intérvalos y con área proporcional a sus frecuencias.

 

Inferir: english to infer; francais inférer; Portuguese inferir

Es emitir juicios o conclusiones basados en algún conocimiento o experiencia sobre un evento o suceso.

 

Inferencia Estadística: english statistical inference; francais une inférence statistique; Portuguese uma inferência estatística

Es aplicar resultados de estudios de una muestra a la poblaciones y emitir juicios o conclusiones sobre esa población en general.  (Estadística)

Ejemplo:

Estudio: Causas de la deserción estudiantil en la Universidad Rómulo Gallegos.
Población: 4000 alumnos.
Muestra: 10% de la población.
Resultados del Estudio de la Muestra: La situación económica, dificultad en el aprendizaje.

Conclusiones: Se puede inferir que las causas de deserción de los alumnos de la Universidad Rómulo Gallegos son la situación económica y la dificultad en el aprendizaje.

 

Intérvalo de Clase: english class interval; francais un intervalle de classe; Portuguese um intervalo de classe

Pequeña sección de la escala según la cual se agrupan las puntuaciones de una distribución de frecuencia. Tamaño o rango de la Clase.

 

Límites del Intérvalo: english interval limits; francais limites de l'intervalle; Portuguese os limites do intervalo

Son los valores extremos que tiene el intérvalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intérvalo de clase.

 

Media Aritmética: english arithmetic mean; francais la moyenne arithmétique; Portuguese a média aritmética

 La media de un conjunto de N números, X1, X2, X3, .. XN. Se define por:

-

(Propiedades de la Media Aritmética)
(Relación Empírica entre Media, Mediana y Moda)
(Media Armónica H)
(Media Geométrica G)
(Relación entre las Medias Aritmética, Geométrica y Armónica)

 

Media Aritmética Ponderada: english weighted arithmetic mean; francais la moyenne arithmétique pondérée; Portuguese a média aritmética ponderada

A veces asociamos con los números X1, X2, X3, .. Xk ciertos factores peso (o pesos) W1, W2, W3, .. WK dependientes de la relevancia asignada a cada nímero. En tal caso,

-

Se llama la media aritmética ponderada con pesos f1, f2, ..., fk.

Ejemplo: Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en los dos parciales, la calificación media es:

-

 

Propiedades de la Media Aritmética

  1. La suma algebraica de las desviaciones de un conjunto de números respecto de su media aritmética es cero.
  2. La suma de los cuadrados de las desviaciones de un conjunto de números Xj respecto de un cierto número "a" es mínima si y sólo si

    - SI f1 números tienen media m1, f2 números tiene m2,...,fk números tienen media mk, entonces la media de todos los números es,

    -

    Es decir, una media aritmética ponderada de todas las medias.

  3. Si A es una media aritmética supuesta o conjeturada (que puede ser cualquier número) y si dj= Xj- A son las desviaciones de Xj respecto de A, las ecuaciones (1) y (2) se convierten, respectivamente, en
- -
Donde -

 

Mediana: english median; francais la médiane; Portuguese a mediana

La mediana de un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales.

Ejemplo: El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6.

Ejemplo: El conjunto de números 5,5,7,9,11,12,15 y18 tiene mediana.-

Para datos agrupados, la mediana obtenida por interpolación viene dada por:

Mediana=-

Donde:

Li= frontera inferior de la clase de la mediana.
N= número de datos (frecuencia total).
-= suma de frecuencia de las clases inferiores a la de la mediana.
fmediana= frecuencia de la clase de la mediana.
c= anchura del intérvalo de la clase de la mediana.


Geométricamente la mediana es el valor de X (abscisa) que corresponde a la recta vertical que divide un histograma en dos partes de igual área. Ese valor de X se suele denotar por -.

(Relación Empírica entre Media, Mediana y Moda)

 

Medidas de la Dispersión: english measures of dispersion; francais measures de dispersion; Portuguese as medidas de dispersão

Normalmente la estadística también se ocupa de la dispersión de la distribución, es decir, si los datos aparecen sobre todo alrededor de la media o si están distribuidos por todo el rango. Una medida de la dispersión es la diferencia entre dos percentiles, por lo general entre el 25 y el 75. El percentil σ es un número tal que un ρ por ciento de los datos son menores o iguales que ρ . En particular, los percentiles 25 y 75 se denominan cuartiles inferior y superior respectivamente. La desviación típica es otra medida de la dispersión, pero más útil que los percentiles, pues está definida en términos aritméticos como se explica a continuación.

 

Medidas de Tendencia Central: english measures of central tendency; francais les mesures de tendance centrale; Portuguese as medidas de tendência central

Un promedio es un valor típico o representativo de un conjunto de datos. tales valores suelen situarse hacia al centro del conjunto de datos ordenados por magnitud.

Una vez que los datos han sido reunidos y tabulados, comienza el análisis con el objeto de calcular un número único, que represente o resuma todos los datos. Dado que por lo general la frecuencia de los intérvalos centrales es mayor que el resto, este número se suele denominar valor o medida de la tendencia central.

-

Sean X1,X2,...,Xn los datos de un estudio estadístico. El valor utilizado mas a menudo es la media aritmética o promedio aritmético que se escribe X , y que es igual a la suma de todos los valores dividida por n.

El símbolo å 1 o sumatorio, denota la suma de todos los datos. Si las X se agrupan en K intérvalos, con puntos medios m1,m2,..., mk y frecuencias f1,f2,...,fk, la media aritmética viene dada por:

-

donde i=1,2,...,k. La mediana y la moda son otros dos valores de la tendencia central. Si las x se ordenan según sus valores numéricos, si n es impar la mediana es la x que ocupa la posición central y si n es par la mediana es la media o promedio de las dos x centrales. La moda es la x que aparece con mayor frecuencia. Si dos o más x aparecen con igual máxima frecuencia, se dice que el conjunto de las x no tiene moda, o es bimodal, siendo la moda las dos x que aparecen con más frecuencia, o es trimodal, con modas las tres x más frecuentes.

 

Relación Empírica entre Media, Mediana y Moda english mean, median, mode; francais  la moyenne, la médiane, le mode; Portuguese a média, a mediana, a moda

Para curvas de frecuencia unimodales que sean poco asimétricas tenemos la siguiente relación empírica

Media – Moda = 3(media- mediana)

Posiciones relativas de la media, la mediana y la moda para curvas de frecuencia asimétrica a derecha e izquierda, respectivamente, para curvas simétricas los tres valores coinciden.

-

-


 

Moda: english mode; francais le mode; Portuguese a moda

Es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir, e incluso no ser única en caso de existir.

Ejemplo: El conjunto 2,2,5,7,9,9,9,10,10,11,12 y 18 tiene moda 9.
Ejemplo: El conjunto 3,5,8,10,12,15 y 16 no tiene moda.
Ejemplo: El conjunto 2,3,4,4,4,5,5,7,7,7 y 9 tiene dos modas, 4 y 7 y se llama bimodal.

Una distribución con moda única se dice unimodal.

En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar los datos, la moda será el valor (o valores) de X correspondiente al máximo (o máximos) de la curva. Ese valor de X se denota por -.

La moda puede deducirse de una distribución de frecuencias o de un histograma a partir de la fórmula:

-

donde:

L1 = frontera inferior de la clase modal (clase que contiene a la moda).
-= exceso de la frecuencia modal sobre la de la clase inferior inmediata.
-= exceso de la frecuencia modal sobre la de la clase superior nmediata.
c= anchura del intérvalo de clase modal.


(Relación Empírica entre Media, Mediana y Moda)

 

Observación de Campo: english field observation; francais enquête sur le terrain; Portuguese observação de campo

Es la observación que realiza el investigador en el lugar donde ocurren los sucesos o eventos, para extraer los datos.

 

Población y Muestra: english population, sample; francais la population, un échantillon; Portuguese a população, uma amostra

Al recoger datos relativos a las características de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fábrica, suele ser imposible o nada práctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra.

Una población puede ser finita o infinita. Por ejemplo, la población consistente en todas las tuercas producidas por una fábrica un cierto día es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita.

Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre las poblaciones a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones.

La parte de la estadística que sólo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva.

 

Polígono de frecuencia: english frequency polygon; francais le polygone des fréquences; Portuguese o polígono de frequência

Se obtiene conectando los puntos medios de cada intérvalo de un histograma de frecuencias acumuladas con segmentos rectilíneos.

 

Porcentaje: english percentage; francais le pourcentage; Portuguese a porcentagem

Es la proporción de una cantidad de datos específicos, con respecto al total de esos datos.

 

Probabilidad: english probability; francais la probabilité; Portuguese a probabilidade

Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a través de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 y uno que ocurra con certeza es de 1.

Ejemplo: Cuando se lanza una moneda, se desea saber cual es la probabilidad de que se sello o cara, es decir existe un 0,5 (50%) de que sea cara o 0,5 (50%) de que sea sello.

 

Promedio: english average; francais le milieu; Portuguese a média

Es una medida que caracteriza un grupo de datos bajo algún criterio. Como: la media aritmética y la media ponderada.

 

Rango: english rank; francais le rang; Portuguese o posto

Situación de un dato respecto de una distribución.

 

Tamaño de la Muestra: english sample size; francais la taille de l'échantillon; Portuguese o tamanho da amostra

Es la cantidad de datos que serán extraidos de la población para formar parte de la muestra.

 

Validez: english validity; francais la validité; Portuguese a validade

Importancia predictiva para los propósitos que se persiguen. (Validez)


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

back