Nini Pandas 1.0 ilituletea

Nini Pandas 1.0 ilituletea

Mnamo Januari 9, Pandas 1.0.0rc ilitolewa. Toleo la awali la maktaba ni 0.25.

Toleo kuu la kwanza lina vipengele vingi vipya, ikiwa ni pamoja na muhtasari ulioboreshwa wa mfumo wa data kiotomatiki, miundo zaidi ya matokeo, aina mpya za data na hata tovuti mpya ya uhifadhi.

Mabadiliko yote yanaweza kutazamwa hapa, katika makala tutajiwekea kikomo kwa ukaguzi mdogo wa kiufundi wa mambo muhimu zaidi.

Unaweza kusakinisha maktaba kama kawaida kwa kutumia pip, lakini tangu wakati wa kuandika Pandas 1.0 bado kuachilia mgombea, utahitaji kutaja toleo hilo kwa uwazi:

pip install --upgrade pandas==1.0.0rc0

Kuwa mwangalifu: kwa kuwa hili ni toleo kuu, sasisho linaweza kuvunja msimbo wa zamani!

Kwa njia, msaada wa Python 2 umekataliwa kabisa tangu toleo hili (nini inaweza kuwa sababu nzuri sasisha - takriban. tafsiri) Pandas 1.0 inahitaji angalau Python 3.6+, kwa hivyo ikiwa huna uhakika, angalia ni ipi ambayo umesakinisha:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Njia rahisi zaidi ya kuangalia toleo la Pandas ni hii:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Ufupisho wa kiotomatiki ulioboreshwa na DataFrame.info

Ubunifu niliopenda zaidi ulikuwa sasisho la njia DataFrame.info. Kitendaji kimekuwa kikisomeka zaidi, na kufanya mchakato wa uchunguzi wa data kuwa rahisi zaidi:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Kutoa majedwali katika umbizo la Markdown

Ubunifu unaopendeza vile vile ni uwezo wa kusafirisha fremu za data kwenye jedwali la Markdown kwa kutumia DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Hii hurahisisha zaidi kuchapisha jedwali kwenye tovuti kama Medium kwa kutumia github gists.

Nini Pandas 1.0 ilituletea

Aina mpya za nyuzi na booleans

Toleo la Pandas 1.0 pia liliongeza mpya majaribio aina. API yao bado inaweza kubadilika, kwa hivyo itumie kwa tahadhari. Lakini kwa ujumla, Pandas inapendekeza kutumia aina mpya popote ina maana.

Kwa sasa, uigizaji unahitaji kufanywa kwa uwazi:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Angalia jinsi safu Aina ya D huonyesha aina mpya - string ΠΈ bool.

Kipengele muhimu zaidi cha aina mpya ya kamba ni uwezo wa kuchagua safu mlalo pekee kutoka kwa mfumo wa data. Hii inaweza kufanya uchanganuzi wa data ya maandishi kuwa rahisi zaidi:

df.select_dtypes("string")

Hapo awali, safu mlalo hazingeweza kuchaguliwa bila kubainisha majina kwa uwazi.

Unaweza kusoma zaidi kuhusu aina mpya hapa.

Asante kwa kusoma! Orodha kamili ya mabadiliko, kama ilivyotajwa tayari, inaweza kutazamwa hapa.

Chanzo: mapenzi.com

Kuongeza maoni