
Pandas 1.0.0rc kom út 9. janúar. Fyrri útgáfa bókasafnsins var 0.25.
Fyrsta stóra útgáfan inniheldur marga frábæra nýja eiginleika, þar á meðal bætta sjálfvirka gagnarammasamtölu, fleiri úttakssnið, nýjar gagnategundir og jafnvel nýja skjölunarsíðu.
Hægt er að skoða allar breytingar Í þessari grein munum við takmarka okkur við stutta, minna tæknilega yfirsýn yfir það mikilvægasta.
Þú getur sett upp bókasafnið eins og venjulega með því að nota Pip, en þar sem Pandas 1.0 er enn á þeim tíma sem þetta er skrifað lausnarframbjóðandi, þú þarft að tilgreina útgáfuna sérstaklega:
pip install --upgrade pandas==1.0.0rc0Verið varkár: þar sem þetta er stór útgáfa gæti uppfærslan brotið gamlan kóða!
Með því sagt, þessi útgáfa hættir alveg að styðja Python 2 (hvað gæti verið góð ástæða — þýðingarathugasemdPandas 1.0 krefst að minnsta kosti Python 3.6+, svo ef þú ert óviss skaltu athuga hvaða útgáfu þú hefur sett upp:
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5Auðveldasta leiðin til að athuga Pandas útgáfuna er sem hér segir:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0Bætt sjálfvirk summa með DataFrame.info
Uppáhalds nýja eiginleikinn minn var aðferðaruppfærslan DataFrame.infoFallið er orðið mun læsilegra, sem gerir gagnaleit enn auðveldari:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytesÚttak taflna í Markdown sniði
Jafn góð nýjung er möguleikinn á að flytja út gagnaramma í Markdown töflur með því að nota DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |Þetta gerir það miklu auðveldara að birta töflur á síður eins og Medium með því að nota GitHub gists.

Nýjar gerðir fyrir strengi og booleskar gildi
Útgáfan af Pandas 1.0 bætti einnig við nýjum tilraunastarfsemi Tegundir. Forritaskil þeirra gætu enn breyst, svo farið varlega með það. Hins vegar mælir Pandas almennt með því að nota nýjar tegundir hvar sem það er skynsamlegt.
Í bili verður að gera leikaravalið skýrt:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytesTakið eftir hvernig dálkurinn D-gerð sýnir nýjar gerðir - band и bool.
Gagnlegasti eiginleiki nýju strengjategundarinnar er möguleikinn á að velja aðeins dálkar raðir úr gagnarömmum. Þetta getur einfaldað greiningu textagagna verulega:
df.select_dtypes("string")Áður var ekki hægt að velja raðdálka án þess að tilgreina nöfn þeirra sérstaklega.
Þú getur lesið meira um nýju gerðirnar .
Takk fyrir að lesa! Allan listann yfir breytingarnar, eins og áður hefur komið fram, er að finna hér. .
Heimild: www.habr.com
