Mnamo Januari 9, Pandas 1.0.0rc ilitolewa. Toleo la awali la maktaba ni 0.25.
Toleo kuu la kwanza lina vipengele vingi vipya, ikiwa ni pamoja na muhtasari ulioboreshwa wa mfumo wa data kiotomatiki, miundo zaidi ya matokeo, aina mpya za data na hata tovuti mpya ya uhifadhi.
Mabadiliko yote yanaweza kutazamwa
Unaweza kusakinisha maktaba kama kawaida kwa kutumia pip, lakini tangu wakati wa kuandika Pandas 1.0 bado kuachilia mgombea, utahitaji kutaja toleo hilo kwa uwazi:
pip install --upgrade pandas==1.0.0rc0
Kuwa mwangalifu: kwa kuwa hili ni toleo kuu, sasisho linaweza kuvunja msimbo wa zamani!
Kwa njia, msaada wa Python 2 umekataliwa kabisa tangu toleo hili (nini inaweza kuwa sababu nzuri
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Njia rahisi zaidi ya kuangalia toleo la Pandas ni hii:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
Ufupisho wa kiotomatiki ulioboreshwa na DataFrame.info
Ubunifu niliopenda zaidi ulikuwa sasisho la njia DataFrame.info. Kitendaji kimekuwa kikisomeka zaidi, na kufanya mchakato wa uchunguzi wa data kuwa rahisi zaidi:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
Kutoa majedwali katika umbizo la Markdown
Ubunifu unaopendeza vile vile ni uwezo wa kusafirisha fremu za data kwenye jedwali la Markdown kwa kutumia DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
Hii hurahisisha zaidi kuchapisha jedwali kwenye tovuti kama Medium kwa kutumia github gists.
Aina mpya za nyuzi na booleans
Toleo la Pandas 1.0 pia liliongeza mpya majaribio aina. API yao bado inaweza kubadilika, kwa hivyo itumie kwa tahadhari. Lakini kwa ujumla, Pandas inapendekeza kutumia aina mpya popote ina maana.
Kwa sasa, uigizaji unahitaji kufanywa kwa uwazi:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
Angalia jinsi safu Aina ya D huonyesha aina mpya - string ΠΈ bool.
Kipengele muhimu zaidi cha aina mpya ya kamba ni uwezo wa kuchagua safu mlalo pekee kutoka kwa mfumo wa data. Hii inaweza kufanya uchanganuzi wa data ya maandishi kuwa rahisi zaidi:
df.select_dtypes("string")
Hapo awali, safu mlalo hazingeweza kuchaguliwa bila kubainisha majina kwa uwazi.
Unaweza kusoma zaidi kuhusu aina mpya
Asante kwa kusoma! Orodha kamili ya mabadiliko, kama ilivyotajwa tayari, inaweza kutazamwa
Chanzo: mapenzi.com