Apa sing digawa dening Pandas 1.0

Apa sing digawa dening Pandas 1.0

Tanggal 9 Januari, Pandas 1.0.0rc dirilis. Versi perpustakaan sadurunge yaiku 0.25.

Rilis utama pisanan ngemot akeh fitur anyar sing apik, kalebu ringkesan dataframe otomatis sing luwih apik, format output liyane, jinis data anyar, lan malah situs dokumentasi anyar.

Kabeh owah-owahan bisa dideleng kene, ing artikel kita bakal mbatesi awake dhewe menyang review cilik, kurang teknis babagan perkara sing paling penting.

Sampeyan bisa nginstal perpustakaan kaya biasane nggunakake pip, nanging wiwit nalika nulis Pandas 1.0 isih calon ngeculake, sampeyan kudu nemtokake versi kanthi jelas:

pip install --upgrade pandas==1.0.0rc0

Ati-ati: amarga iki minangka rilis utama, nganyari bisa ngilangi kode lawas!

Miturut cara, dhukungan kanggo Python 2 wis rampung mandheg wiwit versi iki (apa bisa dadi alesan apik nganyari - kira-kira. ngartekne). Pandas 1.0 mbutuhake paling ora Python 3.6+, dadi yen sampeyan ora yakin, priksa manawa sampeyan wis nginstal:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Cara paling gampang kanggo mriksa versi Pandas yaiku:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Ngapikake ringkesan otomatis nganggo DataFrame.info

Inovasi favoritku yaiku nganyari metode kasebut DataFrame.info. Fungsi kasebut dadi luwih gampang diwaca, nggawe proses eksplorasi data luwih gampang:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Outputing tabel ing format Markdown

Inovasi sing padha nyenengake yaiku kemampuan kanggo ngekspor kerangka data menyang tabel Markdown nggunakake DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Iki nggawe luwih gampang kanggo nerbitake tabel ing situs kaya Medium nggunakake github gists.

Apa sing digawa dening Pandas 1.0

Jinis anyar kanggo strings lan booleans

Rilis Pandas 1.0 uga nambah anyar eksperimen jinis. API kasebut isih bisa diganti, mula gunakake kanthi ati-ati. Nanging umume, Pandas nyaranake nggunakake jinis anyar ing ngendi wae.

Saiki, para pemain kudu ditindakake kanthi jelas:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Wigati carane kolom Dtype nampilake jinis anyar − senar и bolongan.

Fitur paling migunani saka jinis senar anyar yaiku kemampuan kanggo milih mung kolom baris saka dataframes. Iki bisa nggawe data teks parsing luwih gampang:

df.select_dtypes("string")

Sadurunge, kolom baris ora bisa dipilih tanpa nemtokake jeneng kanthi jelas.

Sampeyan bisa maca liyane babagan jinis anyar kene.

Matur nuwun kanggo maca! Dhaptar owah-owahan lengkap, kaya sing wis kasebut, bisa dideleng kene.

Source: www.habr.com

Tuku hosting sing dipercaya kanggo situs kanthi proteksi DDoS, server VPS VDS 🔥 Tuku hosting situs web sing bisa dipercaya nganggo proteksi DDoS, server VPS VDS | ProHoster