¿Qué son los pandas Python?

Pandas es una biblioteca de Python que le permite trabajar con datos que están organizados usando filas y columnas a veces llamadas "datos tabulares". Probablemente haya utilizado una hoja de cálculo como Excel para manipular datos tabulares. La belleza de Pandas es que puede usarlo para tareas similares para las que usarìa Excel, como la manipulaciòn simple de datos, pero también puede usarlo para impulsar tareas complejas de ciencia de datos como el aprendizaje automático. & Nbsp;

Pandas es una herramienta popular en la ciencia de datos. Se puede utilizar para impulsar decisiones comerciales en todas las industrias, ayudando a las personas a tomar decisiones en áreas como marketing, ventas, creaciòn de productos, finanzas y salud.

¿Qué es Pandas?

Pandas es una biblioteca de Python con herramientas de análisis de datos. El uso de esta biblioteca le permite manipular datos para obtener informaciòn sobre ellos. Wes McKinney creò Pandas y fue desarrollado originalmente para realizar análisis cuantitativos de datos financieros. En 2009, se lanzò Pandas y desde entonces ha ganado popularidad como herramienta para el análisis de datos.

Con Pandas, puede importar datos de bases de datos como Excel. Pandas te permite limpiar tus datos antes de analizarlos. " Limpieza " sus datos, a menudo denominados " disputa de datos " o " data munging & rdquo ;, es un proceso de eliminaciòn de datos erròneos de su conjunto de datos antes de procesarlos y extraer informaciòn de ellos. Es importante tener datos limpios y precisos. De lo contrario, los resultados de su proceso de análisis estarán sesgados en el mejor de los casos e in√∫tiles en el peor.

Cuando use Pandas, probablemente usará una plataforma llamada Jupyter Notebook, una herramienta que se usa a menudo para proyectos de ciencia de datos. Jupyter Notebook le permite limpiar y transformar datos. Con él, también puede realizar tareas como el modelado estadìstico y el aprendizaje automático. Es similar a un editor de còdigo: puede escribir y ejecutar còdigo dentro de él.

Si está familiarizado con Python, conoce estructuras de datos como matrices y diccionarios. En Pandas, la estructura de datos central es un DataFrame, una estructura de datos etiquetada en 2D con columnas, similar a una hoja de cálculo. Una hoja de cálculo suele tener una fila en la parte superior que contiene el tìtulo de cada fila. También tiene una columna al costado que contiene el tìtulo de cada columna. En Pandas, cada uno de estos " tìtulo " secciones se llama ìndice. Al igual que con una hoja de cálculo de Excel, puede modificar esta estructura de datos. & Nbsp;

¿Para qué se usa Pandas?

Pandas se usa para el análisis de datos en el campo de la ciencia de datos. La ciencia de datos es simplemente el estudio de datos, con el objetivo de obtener informaciòn a partir de conjuntos de datos. Un conjunto de datos podrìa incluir solo unas pocas entradas o millones de piezas √∫nicas de informaciòn. El objetivo del cientìfico de datos es extraer significado de esos datos a través de un proceso de refinamiento y análisis. Una vez que se ha realizado el análisis, los resultados se pueden visualizar con herramientas como Matplotlib, otra biblioteca de Python.

El 81% de los participantes afirmò que se sentìa más seguro acerca de sus perspectivas laborales después de asistir a un bootcamp. Asigne a un bootcamp hoy mismo.

El graduado promedio de un bootcamp pasò menos de seis meses en la transiciòn profesional, desde comenzar un bootcamp hasta encontrar su primer trabajo.

Si está interesado en los datos ciencia, definitivamente necesitarás aprender Pandas. Incluso si no quiere ser un cientìfico de datos pero sigue interesado en el proceso de análisis de datos, debe comprender esta valiosa tecnologìa.

En concreto, ¿qué pueden hacer los Pandas?

  • Realice cambios en un archivo existente. Por ejemplo, supongamos que tiene una hoja de cálculo de Excel. Desea realizar algunos cálculos utilizando los datos existentes y agregar algunas columnas que contengan los resultados de esos cálculos. Con Pandas, puede importar la hoja de cálculo original, hacer los cálculos usando unas pocas lìneas de còdigo y luego guardar la hoja de cálculo para que contenga los resultados.
  • Ayudarle a visualizar los datos. Una vez que haya limpiado sus datos, puede representarlos visualmente con Matplotlib. & Nbsp;
  • Cree proyectos de aprendizaje automático. Del mismo modo que puede emparejar Pandas con Matplotlib para ofrecer su visualizaciòn de datos necesidades, también puede combinar Pandas con Scikit-Learn para realizar tareas de aprendizaje automático.

Pandas de aprendizaje

Cada vez más roles comerciales requieren una comprensiòn de los datos. Los datos impulsan las decisiones que se toman en áreas como ventas, marketing y desarrollo de productos, lo que significa que incluso si no es actualmente un cientìfico de datos en su empresa, es posible que se espere que extraiga el significado de los datos. Aprender a usar bibliotecas de Python como Pandas puede ayudarlo a tomar decisiones basadas en datos. Obtenga más informaciòn sobre por qué todo el mundo deberìa saber leer y escribir .

Dicho esto, hay muchas oportunidades de trabajo para las personas que desean enfocarse en el uso de Pandas y otras bibliotecas de Python. Al momento de escribir este artìculo, en LinkedIn hay casi 2.000 ofertas de empleo para puestos en los Estados Unidos que mencionan a los pandas. Otras bolsas de trabajo donde encontrará una demanda de Pandas y otras habilidades de análisis de datos / ciencia de datos incluyen Integrado , Trabajos de datos y Glassdoor . Hired es un sitio web que revoluciona el proceso de b√∫squeda de empleo para los candidatos que buscan empleos en tecnologìa: Establecer crear un perfil, y Hired "coincidirá" usted con las empresas.

Las personas con habilidades en análisis de datos y ciencia de datos pueden ganar buenos salarios. Seg√∫n Glassdoor , el salario medio anual en los EE. UU. Para los analistas de datos es de 62.453 dòlares. Para empresas como Google y Facebook, ese n√∫mero está en el rango de $ 90-100k. Indeed enumera el salario medio de un analista de datos en $ 75.091. Para los cientìficos de datos, las cifras son más altas: seg√∫n Glassdoor , el salario promedio en ciencia de datos es de $ 113.309 y De hecho registra el promedio en $ 122,525.

Pandas es una habilidad importante para averig√ºe si desea mejorar la comprensiòn de los datos en su trabajo actual o si desea ser analista de datos o cientìfico de datos.

¿Cuánto tiempo se tarda en aprender pandas?

Suponiendo que ya conoce Python, deberìa tomarle alrededor de dos semanas comenzar con Pandas. Concéntrese en la manipulaciòn básica de datos cuando comience sus proyectos de Pandas. A medida que mejoren sus habilidades, experimente con usos más complejos, como la visualizaciòn de datos y el aprendizaje automático. El uso de Pandas para el aprendizaje automático requerirá que estés familiarizado con herramientas adicionales como Scikit-Learn, por lo que también querrás aprender esas habilidades. & Nbsp;

Debes conocer Python antes de aprender Pandas. Afortunadamente, Python es un lenguaje altamente legible y es adecuado para programadores que recién están comenzando a aprender desarrollo web. Hay muchos recursos para ayudarte a aprender Python, incluyendo esta guìa completa sobre còmo aprender Python .

Una vez que " Si se ha convertido en un experto en Python, estará listo para probar el análisis de datos con bibliotecas de Python como Pandas.

También debe tener en cuenta que Pandas está construido sobre NumPy, una biblioteca de Python utilizada para matemáticas operaciones, por lo que si está familiarizado con NumPy, puede que le resulte más fácil aprender Pandas.

Una cosa a tener en cuenta mientras está aprendiendo Pandas es que puede instalarlo como parte de la ciencia de datos plataforma llamada Anaconda . Cuando instala Anaconda en su máquina, está instalando todas las bibliotecas, paquetes y otras herramientas de Python que se pueden usar con fines de ciencia de datos, incluidos Pandas, Matplotlib y Jupyter Notebook. & Nbsp;

De hecho , la documentaciòn de Pandas recomienda que descargues Anaconda para obtener Pandas en su computadora en lugar de instalar Pandas por separado. Puede descargar Anaconda aquì .

Còmo aprender Pandas: paso a paso

A continuaciòn, se muestran algunas pautas generales para comenzar a aprender Pandas.

  1. Decide por qué quieres aprender Pandas. ¿Quieres ser un ninja del análisis de datos en tu trabajo actual como comercializador, vendedor o gerente de proyectos? ¿O desea pasar a un rol completo de análisis de datos o ciencia de datos?
  2. Conozca Python. Como se mencionò anteriormente, ya debe tener habilidades básicas de Python antes de comenzar con Pandas.
  3. Familiarìcese con las funcionalidades de Pandas. Aplique su estilo de aprendizaje para adquirir habilidades de Pandas: vea videos tutoriales en lìnea, tome un curso o lea un libro sobre Pandas. Hacer esto antes de instalar y usar Pandas le dará una mejor idea de còmo aprovechar mejor Pandas.
  4. Instalar Pandas . La forma más sencilla de instalar Pandas es descargar Anaconda, que incluye Pandas y otras bibliotecas y paquetes de Python para ciencia de datos. Si no desea descargar Anaconda, puede instalar Pandas aquì . & Nbsp; < / li>
  5. Empiece con proyectos básicos de Excel / Pandas . Una forma de familiarizarse con Pandas es usarlo junto con Excel. Consulte este tutorial sobre el uso de Excel con Python y Pandas .
  6. A medida que sus habilidades crezcan, pruebe proyectos más avanzados. Pasar de Excel con proyectos de Pandas como este , donde haces un libro de calificaciones para maestros con Python y Pandas. & nbsp;
  7. Sigue aprendiendo y √∫nete a la comunidad . Contin√∫e perfeccionando sus habilidades creando proyectos y aprendiendo de los demás. Puede interactuar con otros en Pandas y en la comunidad de análisis de datos / ciencia de datos más grande en sitios como Kaggle y StackOverflow .

Los mejores cursos de Pandas

Una de las mejores formas de aumentar tus conocimientos sobre Pandas es tomar un curso. Los cursos te permiten profundizar en un tema y, por lo general, incluyen actividades para ayudarlo a consolidar su comprensiòn. Estos son algunos de los mejores cursos para aprender Pandas.

Udemy: Análisis de datos con Pandas y Python
Costo: $ 19.99

Este curso lo guìa desde la configuraciòn y instalaciòn para usar Pandas como un profesional. Comprenderá conceptos de manipulaciòn de datos como visualizar, ordenar y filtrar, agregar y agrupar. Aprenda sobre tipos de datos como cadenas, booleanos y fechas. Con este curso obtendrá 20.5 horas de contenido de video y un certificado al finalizar.

edX: Analizar datos con Python
Costo: Gratis (el certificado cuesta $ 99)

Este curso le ense√±a còmo utilizar varias herramientas para el análisis de datos. Estos incluyen NumPy, que significa " Python numérico " y es una biblioteca de Python utilizada para operaciones matemáticas; Pandas; SciPy, que significa " Scientific Python " y es un ecosistema de software para matemáticas, ciencias e ingenierìa; y scikit-learn, una biblioteca de Python utilizada para el aprendizaje automático.

Codecademy: Aprenda análisis de datos con Pandas
Costo: Membresìa de Codecademy Pro ($ 19.99 / mes)

Este curso le ense√±a còmo usar Pandas para limpiar y agregar grandes cantidades de datos y emparejar esos datos con Matplotlib, una biblioteca de Python para visualizaciòn de datos, y SciPy, una biblioteca de Python para matemáticas, ciencias e ingenierìa. El curso tarda solo seis horas en completarse e incluye un certificado de finalizaciòn al final.

Pandas Books

Leer libros sobre Python te dará la oportunidad para digerir el contenido escrito por expertos en la materia. Además de tomar cursos, los libros pueden ayudarte a comenzar con tus propios proyectos de Pandas.

"Career Karma entrò en mi vida cuando más lo necesitaba y rápidamente me ayudò a emparejarme con un bootcamp. Dos meses después de graduarme, ¬°Encontré el trabajo de mis sue√±os que se alineaba con mis valores y metas en la vida! "

Venus, ingeniero de software en Rockbot

Este libro es disponible en lìnea de forma gratuita en Github . Es una excelente introducciòn a las bibliotecas de ciencia de datos de Python, incluidas Pandas. Si también estás interesado en algunas de las otras bibliotecas de Python, como Numpy, Matplotlib y Sci-kit-learn, este es un gran libro para ti.

" Aprendiendo los pandas Biblioteca: herramientas de Python para recopilaciòn de datos, análisis de datos y visualizaciòn " por Matt Harrison

CVCHtYWALBcRPQHqLEBlK45Vkrp5lJ9PJgxMpnAIfMfVh8sOyj BtozP73NioXmuBfeC8794i6tDsFlfKT7ffldxMiWmsqbVsz7HR6EifG FcVaKJgwV7BZ3dHG5Zmrbx64LStiO
Crédito de la imagen: Amazon

Este libro le permite aprender acerca de Pandas a través de ejemplos, muestras de còdigo y gráficos. Lo lleva desde la instalaciòn hasta el manejo de DataFrames. Es mejor leerlo una vez que conozca Python, asì que aseg√∫rese de tener un conocimiento competente del lenguaje de programaciòn para aprovecharlo al máximo. Por cierto, " data munging & rdquo ;, o " data wrangling & rdquo ;, es el proceso de refinar los datos antes de analizarlos.

" Python para análisis de datos: análisis de datos con Pandas, NumPy e IPython " por Wes McKinney

: Amazon

Este libro fue escrito por el creador de Pandas. Sepa que Pandas es solo una habilidad que querrá tener en su kit de herramientas de análisis de datos: también debe estar familiarizado con otras tecnologìas como Matplotlib, NumPy y Jupyter. Este libro te ofrece una fantástica introducciòn a todas estas habilidades.

Recursos de Pandas

A medida que contin√∫as tu viaje de aprendizaje de Pandas, querrás recurra a los recursos en lìnea disponibles. Mientras trabaja en proyectos, surgirán preguntas, por lo que debe saber dònde buscar para encontrar las respuestas.

Sitio web oficial de Pandas

QhP6xMcZRuWHCKr Snkj2nLsNPjdpOLxZZXG9cgRNP IY2dUD DIfZ0dGgWT0dR vUgK83okp4pwa6AtlurD4SlgMp Eudwnz9krZLc 3DkMpo5MMFbnIAsHySdvb5oXKN6QWaBz
crédito de la imagen: Sitio web de Pandas

El sitio web oficial de Pandas le permite descargar Pandas, obtener el libro Python para análisis de datos y participar en el Comunidad de Pandas.

P andas Documentaciòn

VobkSjZN4kt9szAjjJfV6iKX1MbqOZAEUlgXCa35YyvgwyrYOjy2JYw2EK5o6NI7vM5b5h57Ks1gAbiCmC7TF472fHip1X07dmbdtNEyKd06pN6VgZOnX7ldhGzxGb3TLAapnAE
Crédito de la imagen: Documentaciòn de Pandas

Uno de los mejores recursos para aprender cualquier tecnologìa nueva es su documentaciòn. Este recurso, disponible de forma gratuita en lìnea, contiene guìas e informaciòn √∫tiles sobre diferentes aspectos de Pandas. Puede aprender còmo comenzar con Pandas, probar tutoriales y leer acerca de todas las tareas que puede realizar con Pandas en la guìa del usuario.

Tutorial de Kaggle Learn Pandas

MNvVF5n0eFq0gOgHJW UsK43yA2B TatNPdXMmHyM62jehF1Wir10fZPxtsc4ovIbG27aHlhucvWzfRvul5xoEuC3EBySiNQTw8NIsGdNHZvZXyh16Ch29Wadn0cxZfSinEXxhON
crédito de la imagen: Kaggle

Kaggle es una plataforma de ciencia de datos que ofrece cursos gratuitos de ciencia de datos además de otros recursos. Uno de estos cursos es su curso Pandas. Lleva alrededor de cuatro horas completarlo y le ayuda a aprender còmo obtener informaciòn de sus datos, còmo realizar tareas de agrupaciòn y clasificaciòn. Kaggle tiene un repositorio de conjuntos de datos que puede utilizar para impulsar sus proyectos de análisis de datos. Además, hay foros a los que puede unirse. Si está interesado en la ciencia de datos, consulte Kaggle.

Learnpython.org pandas Fundamentos Tutorial interactivo

 LLE6Uf5scUzquiZbgvIl6f5RlslIp5aXEEAIcyysBe3EX7Wt7iLcjmz3KaYRT4hytda3UjZuYxESkNsHg X7k9na6QP3EWkpaV8Cjnr 6I8iGEhBqPvTYzirvsZihzaRBcHlBKln
crédito de la imagen: Learnpython.org

¿Listo para ver a Pandas en acciòn? Con este tutorial interactivo, puede ejecutar ejemplos de còdigo en su navegador sin instalar Pandas ni ninguna otra tecnologìa. Este sitio web es un gran recurso para ayudarle a ver còmo funciona Pandas.

¿Deberìa estudiar Pandas?

Pandas es una biblioteca de Python utilizada para la manipulaciòn de datos, refinamiento y análisis. Si ha trabajado con Excel anteriormente, sabe que obtener informaciòn a partir de datos tabulares puede ayudarlo a tomar decisiones comerciales. Pandas también funciona con datos tabulares, pero ofrece una funcionalidad más sofisticada que Excel.

Puede combinar Pandas con una biblioteca de visualizaciòn de datos como Matplotlib para crear hallazgos que se puedan compartir. Cuando combinas Pandas con Scikit-Learn, otra biblioteca de Python, puedes realizar tareas de aprendizaje automático. & Nbsp;

Pandas es una herramienta popular utilizada en los campos de análisis de datos y ciencia de datos. Los trabajos como analistas de datos o cientìficos de datos generalmente ganan excelentes salarios, por lo que este puede ser un movimiento profesional inteligente si tiene las habilidades necesarias para este tipo de trabajo. Incluso si no quieres ser un analista de datos o un cientìfico de datos, aprender Pandas puede ayudarte con tu trabajo diario.

Entonces, ¿deberìas estudiar Pandas? Si está buscando una herramienta que le permita analizar datos de formas interesantes, entonces sì. Y si desea seguir una carrera en análisis de datos o ciencia de datos, definitivamente deberìa aprender Pandas, junto con otras bibliotecas de Python para ciencia de datos.

¬°Empiece a explorar el apasionante mundo de los datos hoy con Pandas!