Beth ddaeth Pandas 1.0 Γ’ ni

Beth ddaeth Pandas 1.0 Γ’ ni

Ar Ionawr 9, rhyddhawyd Pandas 1.0.0rc. Fersiwn blaenorol y llyfrgell yw 0.25.

Mae'r datganiad mawr cyntaf yn cynnwys llawer o nodweddion newydd gwych, gan gynnwys crynhoi ffrΓ’m data awtomatig gwell, mwy o fformatau allbwn, mathau newydd o ddata, a hyd yn oed safle dogfennu newydd.

Gellir gweld yr holl newidiadau yma, yn yr erthygl byddwn yn cyfyngu ein hunain i adolygiad bach, llai technegol o'r pethau pwysicaf.

Gallwch osod y llyfrgell fel arfer gan ddefnyddio pip, ond ers ar adeg ysgrifennu mae Pandas 1.0 yn dal i fod rhyddhau ymgeisydd, bydd angen i chi nodi'r fersiwn yn benodol:

pip install --upgrade pandas==1.0.0rc0

Byddwch yn ofalus: gan fod hwn yn ddatganiad mawr, efallai y bydd y diweddariad yn torri'r hen god!

Gyda llaw, mae cefnogaeth i Python 2 wedi dod i ben yn llwyr ers y fersiwn hon (beth allai fod yn rheswm da diweddariad β€” tua. cyfieithiad). Mae angen Python 1.0+ o leiaf ar Pandas 3.6, felly os nad ydych chi'n siΕ΅r, gwiriwch pa un rydych chi wedi'i osod:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Y ffordd hawsaf i wirio fersiwn Pandas yw hyn:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Gwell awto-grynhoi gyda DataFrame.info

Fy hoff arloesi oedd y diweddariad i'r dull DataFrame.info. Mae'r swyddogaeth wedi dod yn llawer mwy darllenadwy, gan wneud y broses o archwilio data hyd yn oed yn haws:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Tablau allbwn mewn fformat Markdown

Datblygiad newydd yr un mor ddymunol yw'r gallu i allforio fframiau data i dablau Markdown gan ddefnyddio DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Mae hyn yn ei gwneud hi'n llawer haws cyhoeddi tablau ar wefannau fel Canolig gan ddefnyddio gistubau github.

Beth ddaeth Pandas 1.0 Γ’ ni

Mathau newydd ar gyfer llinynnau a booleans

Ychwanegodd datganiad Pandas 1.0 newydd hefyd arbrofol mathau. Gall eu API newid o hyd, felly defnyddiwch ef yn ofalus. Ond yn gyffredinol, mae Pandas yn argymell defnyddio mathau newydd lle bynnag y mae'n gwneud synnwyr.

Am y tro, mae angen gwneud y cast yn benodol:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Sylwch sut mae'r golofn Dtype yn arddangos mathau newydd - llinyn ΠΈ bool.

Nodwedd fwyaf defnyddiol y math llinyn newydd yw'r gallu i ddewis colofnau rhes yn unig o fframiau data. Gall hyn ei gwneud yn llawer haws dosrannu data testun:

df.select_dtypes("string")

Yn flaenorol, ni ellid dewis colofnau rhes heb nodi enwau'n benodol.

Gallwch ddarllen mwy am fathau newydd yma.

Diolch am ddarllen! Gellir gweld y rhestr lawn o newidiadau, fel y crybwyllwyd eisoes yma.

Ffynhonnell: hab.com

Ychwanegu sylw