Cad a thug Pandas 1.0 dúinn

Cad a thug Pandas 1.0 dúinn

Ar 9 Eanáir, scaoileadh Pandas 1.0.0rc. Is é 0.25 an leagan roimhe seo den leabharlann.

Tá go leor gnéithe iontacha nua sa chéad mhóreisiúint, lena n-áirítear achoimre feabhsaithe uathoibríoch ar fhráma sonraí, níos mó formáidí aschuir, cineálacha nua sonraí, agus fiú láithreán nua doiciméadúcháin.

Is féidir féachaint ar gach athrú anseo, san alt cuirfimid teorainn le hathbhreithniú beag, níos lú teicniúil ar na rudaí is tábhachtaí.

Is féidir leat an leabharlann a shuiteáil mar is gnách ag baint úsáide as pip, ach ós rud é ag an am seo á scríobh tá Pandas 1.0 fós iarrthóir a scaoileadh, beidh ort an leagan a shonrú go sainráite:

pip install --upgrade pandas==1.0.0rc0

Bí cúramach: ós rud é gur mór-eisiúint é seo, féadfaidh an nuashonrú an seanchód a bhriseadh!

Dála an scéil, tá an tacaíocht do Python 2 scortha go hiomlán ón leagan seo (cad a d'fhéadfadh a bheith ina chúis mhaith nuashonrú — thart. aistriúchán). Tá Python 1.0+ ar a laghad ag teastáil ó Pandas 3.6, mar sin mura bhfuil tú cinnte, seiceáil an ceann atá suiteáilte agat:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Is é an bealach is éasca chun leagan Pandas a sheiceáil ná seo:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Feabhsaíodh uath-achoimriú le DataFrame.info

Ba é an nuálaíocht is fearr liom ná an nuashonrú ar an modh DataFrame.info. Tá an fheidhm i bhfad níos inléite, rud a fhágann go bhfuil an próiseas taiscéalaíochta sonraí níos éasca fós:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Táblaí aschuir i bhformáid Markdown

Nuáil chomh taitneamhach céanna is ea an cumas frámaí sonraí a onnmhairiú chuig táblaí Markdown ag baint úsáide as DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Déanann sé seo i bhfad níos éasca táblaí a fhoilsiú ar shuímh cosúil le Meánach ag baint úsáide as github gist.

Cad a thug Pandas 1.0 dúinn

Cineálacha nua le haghaidh teaghráin agus booleans

Chuir scaoileadh Pandas 1.0 nua leis freisin turgnamhach cineálacha. Seans go n-athróidh a n-API fós, mar sin bain úsáid as go cúramach é. Ach go ginearálta, molann Pandas úsáid a bhaint as cineálacha nua cibé áit a bhfuil ciall leis.

Go dtí seo, ní mór an teilgthe a dhéanamh go sainráite:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Fógra conas an colún Cineál taispeánann cineálacha nua - teaghrán и bool.

Is é an ghné is úsáidí den chineál teaghrán nua an cumas a roghnú colúin as a chéile amháin ó fhrámaí sonraí. Féadann sé seo sonraí téacs a pharsáil i bhfad níos éasca:

df.select_dtypes("string")

Roimhe seo, níorbh fhéidir colúin ró a roghnú gan ainmneacha a shonrú go sainráite.

Is féidir leat tuilleadh a léamh faoi chineálacha nua anseo.

Go raibh maith agat as léamh! Is féidir liosta iomlán na n-athruithe, mar a luadh cheana, a fheiceáil anseo.

Foinse: will.com

Add a comment