Það sem Pandas 1.0 færði okkur

Það sem Pandas 1.0 færði okkur

Pandas 1.0.0rc kom út 9. janúar. Fyrri útgáfa bókasafnsins var 0.25.

Fyrsta stóra útgáfan inniheldur marga frábæra nýja eiginleika, þar á meðal bætta sjálfvirka gagnarammasamtölu, fleiri úttakssnið, nýjar gagnategundir og jafnvel nýja skjölunarsíðu.

Hægt er að skoða allar breytingar hérÍ þessari grein munum við takmarka okkur við stutta, minna tæknilega yfirsýn yfir það mikilvægasta.

Þú getur sett upp bókasafnið eins og venjulega með því að nota Pip, en þar sem Pandas 1.0 er enn á þeim tíma sem þetta er skrifað lausnarframbjóðandi, þú þarft að tilgreina útgáfuna sérstaklega:

pip install --upgrade pandas==1.0.0rc0

Verið varkár: þar sem þetta er stór útgáfa gæti uppfærslan brotið gamlan kóða!

Með því sagt, þessi útgáfa hættir alveg að styðja Python 2 (hvað gæti verið góð ástæða uppfæra — þýðingarathugasemdPandas 1.0 krefst að minnsta kosti Python 3.6+, svo ef þú ert óviss skaltu athuga hvaða útgáfu þú hefur sett upp:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Auðveldasta leiðin til að athuga Pandas útgáfuna er sem hér segir:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Bætt sjálfvirk summa með DataFrame.info

Uppáhalds nýja eiginleikinn minn var aðferðaruppfærslan DataFrame.infoFallið er orðið mun læsilegra, sem gerir gagnaleit enn auðveldari:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Úttak taflna í Markdown sniði

Jafn góð nýjung er möguleikinn á að flytja út gagnaramma í Markdown töflur með því að nota DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Þetta gerir það miklu auðveldara að birta töflur á síður eins og Medium með því að nota GitHub gists.

Það sem Pandas 1.0 færði okkur

Nýjar gerðir fyrir strengi og booleskar gildi

Útgáfan af Pandas 1.0 bætti einnig við nýjum tilraunastarfsemi Tegundir. Forritaskil þeirra gætu enn breyst, svo farið varlega með það. Hins vegar mælir Pandas almennt með því að nota nýjar tegundir hvar sem það er skynsamlegt.

Í bili verður að gera leikaravalið skýrt:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Takið eftir hvernig dálkurinn D-gerð sýnir nýjar gerðir - band и bool.

Gagnlegasti eiginleiki nýju strengjategundarinnar er möguleikinn á að velja aðeins dálkar raðir úr gagnarömmum. Þetta getur einfaldað greiningu textagagna verulega:

df.select_dtypes("string")

Áður var ekki hægt að velja raðdálka án þess að tilgreina nöfn þeirra sérstaklega.

Þú getur lesið meira um nýju gerðirnar hér.

Takk fyrir að lesa! Allan listann yfir breytingarnar, eins og áður hefur komið fram, er að finna hér. hér.

Heimild: www.habr.com

Kauptu áreiðanlega hýsingu fyrir síður með DDoS vernd, VPS VDS netþjónum 🔥 Kauptu áreiðanlega vefhýsingu með DDoS vörn, VPS VDS netþjónum | ProHoster