Dak li ġabilna Pandas 1.0

Dak li ġabilna Pandas 1.0

Fid-9 ta 'Jannar, Pandas 1.0.0rc ġie rilaxxat. Il-verżjoni preċedenti tal-librerija hija 0.25.

L-ewwel ħarġa maġġuri fiha ħafna karatteristiċi ġodda kbar, inkluż sommarju mtejjeb tal-qafas tad-data awtomatiku, aktar formati ta 'output, tipi ta' data ġodda, u anke sit ta 'dokumentazzjoni ġdid.

Il-bidliet kollha jistgħu jitqiesu hawn, fl-artiklu se nillimitaw lilna nfusna għal reviżjoni żgħira u inqas teknika tal-aktar affarijiet importanti.

Tista 'tinstalla l-librerija bħas-soltu bl-użu pip, iżda peress li fil-ħin tal-kitba Pandas 1.0 għadu kandidat rilaxx, ser ikollok bżonn tispeċifika b'mod espliċitu l-verżjoni:

pip install --upgrade pandas==1.0.0rc0

Oqgħod attent: peress li din hija rilaxx maġġuri, l-aġġornament jista 'jkisser il-kodiċi l-antik!

Mill-mod, l-appoġġ għal Python 2 twaqqaf kompletament minn din il-verżjoni (dak li jista 'jkun raġuni tajba aġġornament — madwar. traduzzjoni). Pandas 1.0 jeħtieġ mill-inqas Python 3.6+, allura jekk m'intix ċert, iċċekkja liema waħda installajt:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

L-eħfef mod biex tiċċekkja l-verżjoni Pandas huwa dan:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Auto-sommarizzazzjoni mtejba b'DataFrame.info

L-innovazzjoni favorita tiegħi kienet l-aġġornament tal-metodu DataFrame.info. Il-funzjoni saret ħafna aktar leġibbli, u tagħmel il-proċess ta 'esplorazzjoni tad-dejta saħansitra aktar faċli:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Outputing tabelli fil-format Markdown

Innovazzjoni ugwalment pjaċevoli hija l-abbiltà li tesporta dataframes għal tabelli Markdown bl-użu DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Dan jagħmilha ferm aktar faċli li tippubblika tabelli fuq siti bħal Medium bl-użu ta 'github gists.

Dak li ġabilna Pandas 1.0

Tipi ġodda għal kordi u booleans

Ir-rilaxx Pandas 1.0 żied ukoll ġdid sperimentali tipi. L-API tagħhom xorta jistgħu jinbidlu, għalhekk użaha b'kawtela. Iżda b'mod ġenerali, Pandas jirrakkomanda li tuża tipi ġodda kull fejn jagħmel sens.

Għalissa, il-cast jeħtieġ li jsir b'mod espliċitu:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Avviż kif il-kolonna Dtype juri tipi ġodda − sekwenza и bool.

L-iktar karatteristika utli tat-tip ta 'sekwenza ġdida hija l-abbiltà li tagħżel kolonni ringiela biss minn dataframes. Dan jista' jagħmel l-analiżi tad-dejta tat-test ħafna aktar faċli:

df.select_dtypes("string")

Preċedentement, il-kolonni tar-ringieli ma setgħux jintgħażlu mingħajr ma jiġu speċifikati b'mod espliċitu l-ismijiet.

Tista 'taqra aktar dwar tipi ġodda hawn.

Grazzi talli qrajt! Il-lista sħiħa tal-bidliet, kif diġà ssemma, tista 'tara hawn.

Sors: www.habr.com

Żid kumment