Þann 9. janúar kom Pandas 1.0.0rc út. Fyrri útgáfan af bókasafninu er 0.25.
Fyrsta stóra útgáfan inniheldur marga frábæra nýja eiginleika, þar á meðal bætta sjálfvirka gagnarammasamantekt, fleiri úttakssnið, nýjar gagnagerðir og jafnvel ný skjalasíðu.
Hægt er að skoða allar breytingar
Þú getur sett upp bókasafnið eins og venjulega með því að nota Pip, en þar sem þegar þetta er skrifað er Pandas 1.0 enn losunarframbjóðandi, þú þarft að tilgreina sérstaklega útgáfuna:
pip install --upgrade pandas==1.0.0rc0
Verið varkár: þar sem þetta er meiriháttar útgáfa gæti uppfærslan brotið gamla kóðann!
Við the vegur, stuðningur við Python 2 hefur verið algjörlega hætt síðan þessi útgáfa (hvað gæti verið góð ástæða
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Auðveldasta leiðin til að athuga Pandas útgáfuna er þessi:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
Bætt sjálfvirk samantekt með DataFrame.info
Uppáhaldsnýjungin mín var uppfærslan á aðferðinni DataFrame.info. Aðgerðin er orðin miklu læsilegri, sem gerir gagnaleit enn auðveldara:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
Úttak töflur í Markdown sniði
Jafn skemmtileg nýjung er hæfileikinn til að flytja gagnaramma út í Markdown töflur með því að nota DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
Þetta gerir það miklu auðveldara að birta töflur á síðum eins og Medium með því að nota github meginatriði.
Nýjar tegundir fyrir strengi og boolean
Pandas 1.0 útgáfan bætti einnig við nýjum tilraunastarfsemi tegundir. API þeirra gæti enn breyst, svo notaðu það með varúð. En almennt mælir Pandas með því að nota nýjar tegundir hvar sem það er skynsamlegt.
Í bili þarf að gera hlutverkið sérstaklega:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
Taktu eftir hvernig dálkurinn Dtype sýnir nýjar gerðir - band и bool.
Gagnlegasti eiginleiki nýju strengjagerðarinnar er hæfileikinn til að velja aðeins röð dálka úr gagnarömmum. Þetta getur gert þáttun textagagna mun auðveldari:
df.select_dtypes("string")
Áður var ekki hægt að velja línudálka án þess að tilgreina nöfn sérstaklega.
Þú getur lesið meira um nýjar tegundir
Þakka þér fyrir að lesa! Hægt er að skoða heildarlistann yfir breytingar, eins og áður hefur komið fram
Heimild: www.habr.com