Artículos

11.4: Graficar datos - Matemáticas


Aquí hay algunos comandos preliminares para ejecutar si aún no lo han hecho.

Y para esta sección, necesitaremos informar a julia para usar el paquete Plots:

Querremos producir gráficos de conjuntos de datos, comenzaremos con solo algunos datos aleatorios. Lo siguiente produce los valores de 1 a 10 para x y números enteros aleatorios entre 1 y 10 para y:

Lo siguiente producirá un diagrama de dispersión de los datos, donde cada punto se representa como un punto.

Si quisiéramos que los datos se trazaran con líneas que conectan los puntos, usamos el mismográficocomando como lo hicimos arriba.

y podemos trazar puntos y líneas con:


Trazar datos CSV hacer declaraciones estadísticas en Mathematica / WA

Primero, soy bastante nuevo en Mathematica, lo siento de antemano si algunas preguntas parecen triviales.

Tengo un archivo CSV que se parece a esto:

perc es un porcentaje entre 0… 1 l1 y l2 son números, diff es la diferencia entre l1 y l2. Esas son las primeras líneas que tiene el conjunto completo.

150.000 líneas de largo con perc de 0 a 1.

Quiero trazar esos datos y WolframAlpha (e incluso GoogleDocs) hacen un buen trabajo aquí y obtengo un resultado como este (en realidad, esto no es del todo correcto perc debe ser graficado en X, l1, l2 y diff en Y Espero que sepas a qué me refiero.

Sin embargo, esto solo funciona si mi CSV es menor que

4000 filas. Si es más grande, WA falla y "no sabe cómo interpretar los datos", lo mismo para Google Docs. Entonces, quiero rehacer esto en Mathematica, pero no sé cómo / no funciona.

data = Importar ["data.csv", "Table", "HeaderLines" - & gt 1]

Pero luego fallo con ListPlot porque no sé qué opciones necesita para trazar los datos de forma correspondiente a WA.


Conceptos esenciales

Aunque es seguro que han experimentado tramas y gráficos en la escuela secundaria, los estudiantes a menudo tienen dificultades con los conceptos básicos de la creación de gráficos. Cuando enseño gráficas, encuentro que hay cinco conceptos importantes con los que espero que mis alumnos estén familiarizados:

  1. ¿Qué es una gráfica?
  2. construir diagramas y gráficos significativos
  3. trazar datos x-y en un gráfico
  4. describir diagramas o gráficos
  5. leer e interpretar datos de gráficos

Puede especificar un punto utilizando un par ordenado de números, (x, y). El primer número del par corresponde a un número en el eje xy el segundo número corresponde a un número en el eje y. Los números del par ordenado se denominan coordenada xy coordenada y del punto.

Los puntos A, B y C se grafican en el plano de coordenadas de arriba. Comenzando desde el origen, siga los pasos a continuación para encontrar el número real de cada coordenada en el par ordenado.

  1. Para el punto A, muévase hacia la derecha 3 unidades en el eje x para obtener una coordenada x de 3, luego muévase 4 unidades hacia arriba en el eje y para obtener una coordenada y de 4.
  2. Para el punto B, muévase hacia la izquierda 4 unidades en el eje x para obtener una coordenada x de -4. Dado que no hay una distancia vertical para moverse en el eje y, la coordenada y es 0.
  3. Para el punto C, muévase hacia la derecha 4 unidades en el eje x para obtener una coordenada x de 4, luego baje 4 unidades en el eje y para obtener una coordenada y de -4.

Media, mediana y moda: tendencias de datos, detección de anomalías y usos en los deportes

- Guía escrita por Corin B. Arenas, publicado el 17 de octubre de 2019

En la escuela, pedimos la puntuación media de una prueba para saber si tenemos una buena nota. Cuando se trata de comprar productos caros, a menudo pedimos el precio medio para buscar las mejores ofertas.

Estos son solo algunos ejemplos de cómo se utilizan los promedios en la vida real.

En esta sección, aprenderá sobre los diferentes tipos de promedios y cómo se calculan y aplican en varios campos, especialmente en los deportes.

¿Qué significa el término "promedio"?

Cuando las personas describen el "promedio" de un grupo de números, a menudo se refieren a la media aritmética. Este es uno de los 3 tipos diferentes de promedio, que incluyen la mediana y la moda.

Tipos de promedioDescripción
Significar El promedio de números en un grupo.
Mediana El número del medio en un conjunto de números.
Modo El número que aparece con más frecuencia en un conjunto de números.

En términos de conversación, la mayoría de las personas simplemente dicen "promedio" cuando en realidad se refieren a la media. Aritmética significar y promedio son palabras sinónimos que se usan indistintamente, según Dictionary.com.

Se calcula sumando los números de un conjunto y dividiéndolo por el número total del conjunto, que es lo que hace la mayoría de las personas cuando encuentran el promedio. Vea el ejemplo a continuación.

Conjunto: 8, 12, 9, 7, 13, 10
Media = (8 + 12 + 9 + 7 + 13 + 10) / 6
= 59 / 6
= 9.83
La media o media aritmética en este ejemplo es 9.83.

Mediana

La mediana, por otro lado, es otro tipo de promedio que representa el número del medio en una secuencia ordenada de números. Esto funciona ordenando una secuencia de números (en orden ascendente) y luego determinando el número que aparece en el medio del conjunto. Vea el ejemplo a continuación.

Media media

Conjunto: 22, 26, 29, 33, 39, 40, 42, 47, 53
En este ejemplo, 39 es el valor mediano o medio del conjunto.

La modo es básicamente el valor más frecuente que se repite en un conjunto de valores. Por ejemplo, si su conjunto tiene 21, 9, 14, 3, 11, 33, 5, 9, 16, 21, 5, 9, ¿cuál es la moda?

La respuesta es 9 porque este valor se repite 3 veces.

En estadística, media, mediana y moda son términos que se utilizan para medir la tendencia central en una muestra de datos. Esto se ilustra en el gráfico de distribución normal a continuación.

El gráfico de distribución normal se utiliza para visualizar la desviación estándar en el análisis de datos. La distribución de datos estadísticos muestra la frecuencia con la que ocurren los valores en un conjunto de datos.

En el gráfico anterior, los porcentajes representan la cantidad de valores que caen dentro de cada sección. Los porcentajes resaltados básicamente muestran cuántos datos se encuentran cerca de la mitad del gráfico.

¿Cuál es la relación entre la media, la mediana y la moda?

A primera vista, parecería que no existe ninguna conexión entre la media, la mediana y la moda. Pero existe una relación empírica que existe al medir el centro de un conjunto de datos.

Los matemáticos han observado que suele haber una diferencia entre la mediana y la moda, y es 3 veces la diferencia entre la media y la mediana.

La relación empírica se expresa en la siguiente fórmula:
Media - Moda = 3 (Media - Mediana)

Tomemos el ejemplo de datos de población basados ​​en 50 estados. Por ejemplo, la media de una población es de 7 millones, con una mediana de 4,8 millones y una moda de 1,5 millones.

Media - Moda = 3 (Media - Mediana)
7 millones - 1,5 millones = 3 (7 millones - 4,8 millones)
5,5 millones = 3 (2,2)
5,5 millones = 6,6 millones

Tomar nota: La profesora de matemáticas Courtney Taylor, Ph.D. declaró que no es una relación exacta. Cuando haces cálculos, los números no siempre son precisos. Pero los números correspondientes estarán relativamente cerca.

Datos asimétricos o sesgados

Según Microeconomicsnotes.com, cuando los valores de la media, la mediana y la moda no son iguales, la distribución es asimétrica o sesgada. El grado de asimetría representa la medida en que un conjunto de datos varía de la distribución normal.

Cuando la media es mayor que la mediana y la mediana es mayor que la moda (Media & gt Mediana & gt Modo), es un distribución positivamente sesgada. Se describe como "sesgado hacia la derecha" porque el extremo largo de la curva está hacia la derecha.

En el siguiente gráfico de muestra, la mediana y la moda se encuentran a la izquierda de la media.

Por otro lado, en una distribución sesgada negativamente, la media es menor que la mediana y la mediana es menor que la moda (Media & lt Median & lt Mode). El extremo de cola larga se encuentra hacia el lado izquierdo del gráfico.

El siguiente gráfico muestra la mediana y la moda ubicadas al lado derecho de la media.

Variando la media de la mediana: resúmenes numéricos resistentes

En un conjunto de datos, cuando la media es alta, un lector puede asumir que la mediana también será alta. Sin embargo, esto no siempre sigue.

La diferencia entre la media y la mediana se hace evidente cuando un conjunto de datos tiene un valor dispar periférico. Esta situación llama la atención sobre el concepto de resúmenes numéricos resistentes. Una estadística resistente es un resumen numérico en el que los números extremos no tienen un impacto sustancial en su valor.

Demostremos esto demostrando cómo la presencia de Bill Gates impacta la riqueza media y media cuando entra a una habitación.

Por ejemplo, 10 personas están cenando en un restaurante. Llamémoslo conjunto A. La siguiente tabla muestra sus ingresos de menor a mayor.

Nombre Ingresos anuales
Raffy $33,000
Jessie $38,000
Corin $39,000
Paul $42,000
Kat $46,000
Luigi $49,000
Carl $52,000
Susan $60,000
Miguel $68,000
John $79,000

El ingreso total de las personas en el restaurante es de $ 506.000, con un ingreso medio de $ 50.600.

Dado que hay 10 personas en el conjunto, para obtener la mediana, tenemos que sumar los valores 5º y 6º (ingreso anual de Kat y Luigi) y dividirlo por 2.

Mediana = (46.000 + 49.000) / 2 = 95.000 / 2
= 47,500
El ingreso medio del grupo es de 47.500 dólares.

El rango es la diferencia entre el ingreso más bajo (Raffy) y el ingreso más alto (John), que es $ 46,000.

Establecer un ingreso anual

Ingresos totales $506,000
Significar $506,000
Mediana $47,500
Distancia $46,000

Ahora, si John sale del restaurante y entra Bill Gates, ¿cómo afectará las estadísticas de ingresos anuales del grupo? Llamemos a este próximo grupo conjunto B.

Según Forbes, Bill Gates ganó $ 90 mil millones de 2017 a 2018.

Nombre Ingresos anuales
Raffy $33,000
Jessie $38,000
Corin $39,000
Paul $42,000
Kat $46,000
Luigi $49,000
Carl $52,000
Susan $60,000
Miguel $68,000
Bill Gates $90,000,000,000

Ingresos anuales del conjunto B

Ingresos totales $90,000,427,000
Significar $9,000,042,700
Mediana $47,500
Distancia $89,999,967,000

Con Bill Gates, el ingreso total es ahora de $ 90 mil millones más los ingresos más bajos de las personas en el restaurante. El ingreso medio y el rango del grupo son ahora demasiado altos.

Sin embargo, la mediana sigue siendo la misma en alrededor de $ 47,500.

La mediana muestra que es una mejor indicación del estado financiero real de las personas. Del mismo modo, podemos decir que Bill Gates es un valor atípico con un ingreso anual que alcanza los miles de millones.

Este ejemplo muestra que la media y el rango no son resistentes a valores extremos. Mientras que la mediana, como resumen numérico, generalmente presenta resistencia.

¿Qué nos dice esto? La presencia de valores extremos o valores atípicos indica que una distribución está sesgada. Los valores extremos suelen tirar de la media hacia la dirección de la cola.

La importancia de identificar la asimetría

La observación de la asimetría en un gráfico les da a los analistas una idea más clara de la tendencia de un conjunto de datos. Por ejemplo, si recopiló datos de 500 estudiantes que tomaron la prueba de evaluación académica, querrá conocer la tendencia de la puntuación.

Si traza los datos en un gráfico, sabrá que está sesgado positivamente si hay pocas puntuaciones altas y la mayoría de los valores se agrupan hacia el lado inferior de la escala. Si las puntuaciones tienden hacia el lado más alto de la escala, con pocas puntuaciones bajas, la distribución está sesgada negativamente.

En finanzas, los inversores toman nota de la asimetría cuando analizan la distribución de la rentabilidad. Esto es importante porque les permite ver los rangos extremos de los datos en lugar de solo centrarse en los valores promedio.

Una distribución muestra asimetría (grado de asimetría) o curtosis cuando los retornos caen fuera de la distribución normal. La curtosis mide los valores atípicos en cualquiera de las colas de un gráfico sesgado. Calcula el grado en el que un gráfico alcanza su punto máximo en comparación con una distribución normal.

¿Cómo ayuda a los inversores? La observación de la asimetría o curtosis ayuda a los analistas a predecir los riesgos que resultan cuando se compara un modelo que sigue una distribución normal con un conjunto de datos con una tendencia a una desviación estándar más alta. El riesgo se determina calculando qué tan lejos están los números de la distribución normal.

Cómo identificar anomalías en los datos

En estadística, los valores atípicos o anomalías son observaciones inusuales que no pertenecen a una determinada población.

Cuando se colocan en un gráfico, estos son puntos que se alejan mucho de los valores del conjunto de datos. Los investigadores suelen encontrar valores atípicos basados ​​en datos grandes y bien estructurados.

¿Qué tan diferente debe ser un valor para ser considerado un valor atípico? Para determinar esto, puede utilizar el rango intercuartílico (IQR).

IQR se describe como un resumen de 5 números, que contiene:

  • El valor mínimo de un conjunto de datos
  • El primer cuartil (Q1) - Que es una cuarta parte del camino a través de la secuencia de un conjunto de datos
  • La mediana
  • El tercer cuartil (Q3) Que es tres cuartas partes del camino a través de la secuencia de todos los datos.
  • El valor máximo del conjunto de datos

El rango intercuartílico (IQR) también es similar al rango, pero se considera menos sensible a los valores extremos (estadística de resistencia). Para encontrarlo, debes tomar el primer cuartil y restar el tercer cuartil. Esto muestra cómo se distribuyen los datos alrededor de la mediana.

Detección de valores atípicos mediante IQR

Prácticamente todos los conjuntos de datos pueden describirse mediante el resumen de 5 números. A continuación, le indicamos cómo puede utilizar IQR para encontrar valores atípicos:

  1. Calcule el rango intercuartílico para el conjunto de datos
  2. Multiplica el IQR por 1,5
  3. Agregue IQR x 1.5 al tercer cuartil. La regla: Cualquier valor mayor que este es un valor atípico.
  4. Reste IQR x 1.5 del primer cuartil. La regla: Cualquier valor menor que este es un valor atípico.

Aquí tienes un ejemplo. Suponga que encuentra el valor atípico para el siguiente conjunto de datos:
1, 5, 6, 6, 9, 10, 10, 11, 12, 13, 18
Resumen de 5 números:

  • Valor mínimo = 1
  • Q1 = 6
  • Mediana = 10
  • Q3 = 12
  • Valor máximo = 18

IQR x 1,5 =?
6 x 1,5 = 9
9 + Q3 = ?
9 + 12 = 21 (cualquier valor superior a 21 es un valor atípico)

6 - Q1 = ?
6 – 9 = -3 (cualquier valor menor que -3 es un valor atípico)

Hasta ahora, ningún valor es menor que -3 o mayor que 21 en el conjunto. Aunque el valor máximo 18 es 5 puntos más que 13, no se considera un valor atípico para este conjunto de datos.

Cómo se utilizan los promedios estadísticos en la analítica deportiva

En la analítica deportiva, los investigadores recopilan estadísticas para medir el potencial y la capacidad de los atletas profesionales.

Según Competitive Edge Athletic Performance Center, las métricas de rendimiento deportivo son relevantes para el desarrollo atlético general. Para lograr el éxito en cualquier campo deportivo, las personas deben alcanzar ciertos niveles de atletismo para competir en niveles avanzados.

De hecho, muchos equipos deportivos profesionales consultan a los estadísticos para ayudar a los atletas a rastrear su ventaja competitiva. Esto los guía para mejorar sus rutinas de fuerza y ​​acondicionamiento.

El seguimiento de las métricas de rendimiento ayuda a los atletas a hacer 4 cosas cruciales:

  1. Les ayuda a conocer su nivel actual o línea de base.
  2. Una vez que mejoran, les permite competir en niveles deportivos más altos.
  3. Permite a los atletas identificar las necesidades de entrenamiento individuales.
  4. Puede ayudar a reducir el riesgo de lesiones.

Promedios deportivos populares

El promedio de bateo (BA) es una estadística de rendimiento utilizada en béisbol, cricket y sóftbol. Mide el número de carreras promedio que un jugador puede anotar antes de salir.

Es la herramienta de medición más antigua que mide el éxito de un bateador. Un BA más alto significa que el bateador tiene mayor potencial para anotar carreras sin sacar un out.

El BA se calcula dividiendo los hits de un jugador por su total de turnos al bate, para un valor entre .000 y 1.000.

Según el sitio web de Major League Baseball, el BA de toda la liga en los últimos años se ha mantenido alrededor de .260. Para los mejores bateadores del juego, pueden superar .300.

Sin embargo, algunos atletas excepcionales han bateado por encima de .400, que son 4 hits por cada 10 turnos al bate. MLB afirma que ningún jugador ha hecho esto durante una temporada completa desde Ted Williams (.406) de Boston Red Sox en 1941.

En la temporada 1994 acortada por huelgas, Tony Gwynn estuvo cerca de batear 400, bateando 394 con 164 hits en 419 turnos al bate en 110 juegos.

Aquí hay una tabla de jugadores de la MLB que muestra los líderes promedio de bateo de la temporada regular de 1985 a 2019:

Año Líder de la Liga Nacional Equipo NL licenciado en Letras Líder de la Liga Americana Equipo AL licenciado en Letras
2019 Christian Yelich MIL .329 Tim Anderson CHW .335
2018 Christian Yelich MIL .326 Mookie Betts BOS .346
2017 Charlie Blackmon COLUMNA .331 José Altuve HOU .346
2016 DJ LeMahieu COLUMNA .348 José Altuve HOU .338
2015 Dee Gordon desaparecido en combate .333 Miguel Cabrera DET .338
2014 Justin Morneau COLUMNA .319 José Altuve HOU .341
2013 Michael Cuddyer COLUMNA .331 Miguel Cabrera DET .348
2012 Buster Posey SFG .336 Miguel Cabrera DET .330
2011 Jose reyes NYM .337 Miguel Cabrera DET .344
2010 Carlos gonzalez COLUMNA .336 Josh Hamilton TEXAS .359
2009 Hanley Ramírez FLA .342 Joe Mauer MIN .365
2008 Chipper Jones ATL .364 Joe Mauer MIN .328
2007 Matt Holliday COLUMNA .340 Magglio Ordóñez DET .363
2006 Freddy Sánchez FOSA .344 Joe Mauer MIN .347
2005 Derrek Lee CHC .335 Michael Young TEXAS .331
2004 Barry Bonds SFG .362 Ichiro Suzuki MAR .372
2003 Albert Pujols STL .359 Bill Mueller BOS .326
2002 Barry Bonds SFG .370 Manny ramirez BOS .349
2001 Larry Walker COLUMNA .350 Ichiro Suzuki MAR .350
2000 Todd Helton COLUMNA .372 Nomar Garcíaparra BOS .372
1999 Larry Walker COLUMNA .379 Nomar Garcíaparra BOS .357
1998 Larry Walker COLUMNA .363 Bernie Williams NYY .339
1997 Tony Gwynn partido socialdemócrata .372 Frank Thomas CHW .347
1996 Tony Gwynn partido socialdemócrata .353 Alex Rodriguez MAR .358
1995 Tony Gwynn partido socialdemócrata .368 Edgar Martinez MAR .356
1994 Tony Gwynn partido socialdemócrata .394 Paul O'Neill NYY .359
1993 Andrés Galarraga COLUMNA .370 John Olerud COLINA .363
1992 Gary Sheffield partido socialdemócrata .330 Edgar Martinez MAR .343
1991 Terry Pendleton ATL .319 Julio Franco TEXAS .341
1990 Willie McGee STL .335 George Brett KCR .329
1989 Tony Gwynn partido socialdemócrata .336 Kirby Puckett MIN .339
1988 Tony Gwynn partido socialdemócrata .313 Wade Boggs BOS .366
1987 Tony Gwynn partido socialdemócrata .370 Wade Boggs BOS .363
1986 Tim Raines LUN .334 Wade Boggs BOS .357
1985 Willie McGee STL .353 Wade Boggs BOS .368

En baloncesto, el porcentaje de tiros de campo (FG) se utiliza para medir la eficacia con la que un equipo anota una pelota durante un juego.

FG considera todos los disparos realizados por un jugador. Sin embargo, no incluye los tiros libres que se miden de forma independiente como porcentaje de tiros libres.

La fórmula de FG es el número de disparos exitosos dividido por el número total de intentos de disparo.

Un FG de .500 o 50% y más generalmente se considera un buen porcentaje. Según Basketball Reference, el jugador activo con mayor porcentaje es actualmente DeAndre Jordan, con un 66,96%.

Los jugadores de baloncesto notables como Michael Jordan tienen un FG del 49,69% con una clasificación de 151, mientras que Lebron James se ubica en el 111 con un 50,42%. Los miembros del Salón de la Fama como Kareem Abdul-Jabbar se ubica en el puesto 14 con un 55,95%, mientras que Magic Johnson se ubica en el puesto 64 con un 51,97%.

Basketball Reference identificó los 4 factores que ayudan a los equipos a ganar partidos:

De los 4, el disparo es el factor más importante, seguido de pérdidas de balón, rebotes y tiros libres. Sin embargo, otros argumentarían que, aparte de un porcentaje efectivo de tiros de campo, un juego se gana con una sólida estrategia de defensa.

A continuación se muestra una tabla de los jugadores de la NBA con el mayor porcentaje de tiros de campo.

Los jugadores activos están en negrita.
* Indica un miembro del Salón de la Fama

Rango Nombre % FG
1. DeAndre Jordan .6696
2. Artis Gilmore * .5990
3. Tyson Chandler .5960
4. Dwight Howard .5828
5. Shaquille O'Neal* .5823
6. Mark West .5803
7. Steve Johnson .5722
8. Darryl Dawkins .5720
9. James Donaldson .5706
10. JaVale McGee .5697
Amir Johnson .5697
12. Bo Outlaw .5673
13. Jeff Ruland .5637
14. Kareem Abdul-Jabbar * .5595
15. Jonas Valančiūnas .5583
16. Kevin McHale * .5538
17. Marcin Gortat .5514
18. Bobby Jones * .5504
19. Buck Williams .5492
20. Nenê Hilário .5478

Muchos líderes de porcentaje de tiros de campo son hombres grandes que tienden a encestar y disparar otros tiros interiores de alto porcentaje. En los últimos años, el lanzamiento de tres puntos se ha vuelto más utilizado. Una marca de un gran rendimiento de tiro en general es 50-40-90, donde un jugador tiene un 50% de tiro, 40% desde el rango de 3 puntos y 90% desde la línea de tiros libres.

La línea de fondo

Hay tres tipos de promedios, y estos son la media, la mediana y la moda. De los tres, el más utilizado es la media aritmética. Se determina sumando todos los valores de un conjunto y dividiéndolo por el número total de factores.

El cálculo de la media, la mediana y la moda permite a los investigadores observar la distribución normal o la asimetría en un gráfico. En finanzas, los inversores utilizan esto para medir el riesgo de distribución de la rentabilidad. Para detectar valores atípicos estadísticos, los analistas utilizan el rango intercuartílico.

Calcular promedios es particularmente relevante en la analítica deportiva. Se utiliza para establecer puntos de referencia y mejorar el rendimiento deportivo. Las métricas ayudan a los atletas a optimizar las rutinas de fuerza y ​​acondicionamiento, así como a evitar lesiones.


Tutorial de matemáticas de Microsoft 4 y # 8211 Trazado de gráficos

En este tutorial, aprendemos cómo trazar gráficos cartesianos bidimensionales y tridimensionales y gráficos polares bidimensionales. También aprendemos cómo modificar la configuración de la ventana de gráficos, como el rango de trazado y la visualización proporcional.

1. Abra Microsoft Mathematics.

2. Seleccione el Graficar pestaña.

2. Bajo Ecuaciones y funciones, asegúrate de que 2D y cartesiano están seleccionados.

3. Escriba y. Usa el símbolo ^ para el exponente.

4. Una vez introducidas las ecuaciones, haga clic en el Grafico botón.

Una vez que se muestra el gráfico, puede usar los botones de la barra de herramientas para hacer lo siguiente:

  • Mostrar / ocultar el Ejes, Marcos exteriores, y Líneas de cuadrícula de la gráfica
  • Modificar el Rango de trazado (valores mínimos y máximos de los ejes x-y)
  • Habilitar deshabilitar Pantalla proporcional para establecer la relación x-y en 1: 1
  • Acercar / Alejar si el Pantalla proporcional está habilitado
  • Utilice el rodillo del mouse para acercar o alejar la imagen (incluso si la pantalla proporcional está desactivada
  • Restaurar gráfico para restablecer la configuración predeterminada
  • Restablecer la pestaña de gráficos para borrar la ventana de gráficos
  • Guardar gráfico como imagen

Trazar gráficos polares

Borre la ventana de gráficos haciendo clic en el Restablecer la pestaña de gráficos en la barra de herramientas. Debajo Ecuaciones y funciones, seleccione Polar 2D y gráfico. escribiendo 4 + cos (theta) en el r caja de texto.

Trazado de gráficos 3D

Borre la ventana de gráficos haciendo clic en el Restablecer la pestaña de gráficos en la barra de herramientas. Debajo Ecuaciones y funciones, seleccione 3D cartesiano y gráfico. escribiendo z = x sin (x) + y sin (y) & # 8211 3 en el primer cuadro de texto.


Primer análisis de componentes principales - Sección PCA1

El primer componente principal está fuertemente correlacionado con cinco de las variables originales. El primer componente principal aumenta al aumentar los puntajes de Artes, Salud, Transporte, Vivienda y Recreación. Esto sugiere que estos cinco criterios varían juntos. Si uno aumenta, los restantes tienden a aumentar también. Este componente puede verse como una medida de la calidad de las artes, la salud, el transporte y la recreación, y la falta de calidad en la vivienda (recuerde que los valores altos para la vivienda son malos). Además, vemos que el primer componente principal se correlaciona más fuertemente con las artes. De hecho, podríamos afirmar que con base en la correlación de 0.985, este componente principal es principalmente una medida de las Artes. Se seguiría que las comunidades con valores altos tienden a tener muchas artes disponibles, en términos de teatros, orquestas, etc. Mientras que las comunidades con valores pequeños tendrían muy pocas de este tipo de oportunidades.


Para presentar la lección principal, explico que los gráficos de conversión se pueden usar para representar situaciones de la vida real, como los tipos de cambio de divisas y la conversión entre medidas métricas e imperiales.

En el primer ejemplo, analizamos cómo convertir entre libras esterlinas y euros utilizando un gráfico de conversión prediseñado. Proporciono una copia de la diapositiva de la presentación como folleto para que los estudiantes puedan resolver los problemas conmigo.

Trabajamos con las preguntas a) ad) una a la vez, teniendo cuidado de asegurarnos de dibujar líneas horizontales y verticales precisas desde los ejes. Discutimos que si bien es importante ser lo más precisos posible, debemos usar aproximaciones adecuadas, especialmente cuando se trata de monedas.


Agrupamiento

Ejemplo: acceso a la electricidad en todo el mundo

Algunas personas no tienen acceso a la electricidad (viven en áreas remotas o con servicios deficientes). Una encuesta de muchos países tuvo estos resultados:

País Acceso a la electricidad
(% de población)
Argelia 99.4
Angola 37.8
Argentina 97.2
Bahréin 99.4
Bangladesh 59.6
. . etc

¡Pero espera! ¿Cómo hacemos un diagrama de puntos de eso? Puede haber solo un & quot59.6 & quot y uno & quot37.8 & quot, etc. Casi todos los valores tendrán un solo punto.

La respuesta es agrupar los datos (ponerlo en & quotbins & quot).

En este caso, intentemos redondear cada valor al 10% más cercano:

País Acceso a la electricidad
(% de población,
10% más cercano)
Argelia 100
Angola 40
Argentina 100
Bahréin 100
Bangladesh 60
. . etc

Ahora contamos cuántos de cada agrupación del 10% y estos son los resultados:

Acceso a la electricidad
(% de población,
10% más cercano)
Número de
Países
10 5
20 6
30 12
40 5
50 4
60 5
70 6
80 10
90 15
100 34

Entonces había 5 países donde solo el 10% de la gente tenía acceso a la electricidad, 6 países donde el 20% de la gente tenía acceso a la electricidad, etc.


11.4: Graficar datos - Matemáticas

A distribución de frecuencias se utiliza a menudo para agrupar datos cuantitativos. Los valores de los datos se agrupan en clases de anchos iguales. Las observaciones más pequeñas y más grandes de cada clase se denominan límites de clase, tiempo límites de la clase son valores individuales elegidos para separar clases (a menudo son los puntos medios entre los límites de clase superior e inferior de clases adyacentes).

Por ejemplo, la siguiente tabla proporciona una distribución de frecuencia para los siguientes datos:

Uno debe usar buenos números "redondos" para los límites de su clase siempre que no haya una razón convincente para evitarlo. Hará que su distribución de frecuencia sea más fácil de leer. Por ejemplo, si sus datos comienzan con 43, 46, 48, 48, 52, 57, 58,. puede elegir un límite de clase inferior de 40 y un ancho de clase de 5 (siempre que resulte un número razonable de clases)

A distribución de frecuencia relativa es muy similar, excepto que en lugar de informar cuántos valores de datos caen en una clase, informan la fracción de valores de datos que caen en una clase. Estos se llaman frecuencias relativas y puede expresarse como fracciones, decimales o porcentajes.

A distribución de frecuencia acumulativa es otra variante de una distribución de frecuencia. Aquí, en lugar de informar cuántos valores de datos caen en alguna clase, informan cuántos valores de datos están contenidos en esa clase o en cualquier clase a su izquierda.

La siguiente tabla compara los valores observados en una distribución de frecuencia, una distribución de frecuencia relativa y una distribución de frecuencia acumulativa, para la siguiente secuencia de tiradas de dados $ textrm 7, 6, 7, 6, 7, 4, 4, 6, 10, 5, 6, 11, 4, 8, 2, 9, 6, 5, 3, 8, 3, 3, 12, 9, 10, 7, 6, 7, 4, 6 $ $ begin textrm & textrm & textrm & textrm & textrm hline 2-3 y 1.5 - 3.5 y 4 y 2/15 y 4 hline 4-5 y 3.5 - 5.5 y 6 y 1/5 y 10 hline 6 - 7 y 5.5 - 7.5 y 12 y 2/5 y 22 hline 8 - 9 y 7.5 - 9.5 y 4 y 2/15 y 26 hline 10-11 y 9.5 - 11.5 y 3 y 1/10 y 29 hline 12 - 13 y 11,5 - 13,5 y 1 y 1/30 y 30 end$

A histograma de frecuencia es una versión gráfica de una distribución de frecuencia en la que el ancho y la posición de los rectángulos se utilizan para indicar las diversas clases, y las alturas de esos rectángulos indican la frecuencia con la que los datos caen en la clase asociada, como sugiere el ejemplo siguiente.

Los histogramas de frecuencia deben etiquetarse con límites de clase (como se muestra a continuación) o con puntos medios de clase (en el medio de cada rectángulo).

Por supuesto, uno puede construir de manera similar histogramas de frecuencia relativa y frecuencia acumulada.

El propósito de estos gráficos es "ver" la distribución de los datos. Cuando utilice una calculadora o software para trazar histogramas, experimente con diferentes opciones de límites, sujeto a las restricciones anteriores, para descubrir qué propiedades gráficas (modalidad, asimetría o simetría, valores atípicos, etc.) persisten y cuáles son solo efectos espurios de un elección particular de límites. Luego use los límites que mejor revelen estas propiedades persistentes.

Histogramas de probabilidad

Un tipo de gráfico estrechamente relacionado con un histograma de frecuencia es un histograma de probabilidad, que muestra las probabilidades asociadas con una distribución de probabilidad de manera similar.

Aquí, tenemos un rectángulo para cada valor que puede asumir una variable aleatoria, donde la altura del rectángulo indica la probabilidad de obtener ese valor asociado.

Cuando los valores posibles que puede asumir la variable aleatoria son números enteros consecutivos, los lados izquierdo y derecho de los rectángulos se toman como los puntos medios entre estos números enteros, lo que los obliga a que todos terminen en .5 $. Además, el ancho de cada rectángulo es $ 1 $, lo que significa que no solo la altura del rectángulo es igual a la probabilidad de que ocurra el valor correspondiente, sino que también lo hace el área del rectángulo. (Estas observaciones se vuelven muy importantes más adelante cuando aplicamos una "corrección de continuidad" para aproximar una distribución de probabilidad discreta con una continua.)


Ver el vídeo: MATH 1332 - - Fundamentals of Probability (Noviembre 2021).