Það sem Pandas 1.0 færði okkur

Það sem Pandas 1.0 færði okkur

Þann 9. janúar kom Pandas 1.0.0rc út. Fyrri útgáfan af bókasafninu er 0.25.

Fyrsta stóra útgáfan inniheldur marga frábæra nýja eiginleika, þar á meðal bætta sjálfvirka gagnarammasamantekt, fleiri úttakssnið, nýjar gagnagerðir og jafnvel ný skjalasíðu.

Hægt er að skoða allar breytingar hér, í greininni munum við takmarka okkur við litla, minna tæknilega úttekt á mikilvægustu hlutunum.

Þú getur sett upp bókasafnið eins og venjulega með því að nota Pip, en þar sem þegar þetta er skrifað er Pandas 1.0 enn losunarframbjóðandi, þú þarft að tilgreina sérstaklega útgáfuna:

pip install --upgrade pandas==1.0.0rc0

Verið varkár: þar sem þetta er meiriháttar útgáfa gæti uppfærslan brotið gamla kóðann!

Við the vegur, stuðningur við Python 2 hefur verið algjörlega hætt síðan þessi útgáfa (hvað gæti verið góð ástæða uppfærsla — ca. þýðing). Pandas 1.0 krefst að minnsta kosti Python 3.6+, svo ef þú ert ekki viss skaltu athuga hvern þú hefur sett upp:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Auðveldasta leiðin til að athuga Pandas útgáfuna er þessi:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Bætt sjálfvirk samantekt með DataFrame.info

Uppáhaldsnýjungin mín var uppfærslan á aðferðinni DataFrame.info. Aðgerðin er orðin miklu læsilegri, sem gerir gagnaleit enn auðveldara:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Úttak töflur í Markdown sniði

Jafn skemmtileg nýjung er hæfileikinn til að flytja gagnaramma út í Markdown töflur með því að nota DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Þetta gerir það miklu auðveldara að birta töflur á síðum eins og Medium með því að nota github meginatriði.

Það sem Pandas 1.0 færði okkur

Nýjar tegundir fyrir strengi og boolean

Pandas 1.0 útgáfan bætti einnig við nýjum tilraunastarfsemi tegundir. API þeirra gæti enn breyst, svo notaðu það með varúð. En almennt mælir Pandas með því að nota nýjar tegundir hvar sem það er skynsamlegt.

Í bili þarf að gera hlutverkið sérstaklega:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Taktu eftir hvernig dálkurinn Dtype sýnir nýjar gerðir - band и bool.

Gagnlegasti eiginleiki nýju strengjagerðarinnar er hæfileikinn til að velja aðeins röð dálka úr gagnarömmum. Þetta getur gert þáttun textagagna mun auðveldari:

df.select_dtypes("string")

Áður var ekki hægt að velja línudálka án þess að tilgreina nöfn sérstaklega.

Þú getur lesið meira um nýjar tegundir hér.

Þakka þér fyrir að lesa! Hægt er að skoða heildarlistann yfir breytingar, eins og áður hefur komið fram hér.

Heimild: www.habr.com

Bæta við athugasemd