Naon Pandas 1.0 dibawa ka kami

Naon Pandas 1.0 dibawa ka kami

Dina 9 Januari, Pandas 1.0.0rc dileupaskeun. Versi perpustakaan saméméhna nyaéta 0.25.

Kaluaran utama munggaran ngandung loba fitur anyar hébat, kaasup ningkat dataframe summarization otomatis, format output leuwih, tipe data anyar, komo situs dokuméntasi anyar.

Sadaya parobihan tiasa ditingali di dieu, dina artikel urang bakal ngawatesan diri kana leutik, review kirang teknis ngeunaan hal pangpentingna.

Anjeun tiasa install perpustakaan sakumaha biasa ngagunakeun pip, Tapi saprak dina waktu nulis Pandas 1.0 masih calon ngaleupaskeun, anjeun bakal kedah sacara eksplisit nangtukeun versi:

pip install --upgrade pandas==1.0.0rc0

Ati-ati: kumargi ieu mangrupikeun rilis utama, pembaruan tiasa ngarobih kodeu lami!

Ku jalan kitu, dukungan pikeun Python 2 parantos dileungitkeun ti saprak versi ieu (naon bisa jadi alesan alus apdet - kira-kira. tarjamahan). Pandas 1.0 ngabutuhkeun sahenteuna Python 3.6+, janten upami anjeun henteu yakin, pariksa mana anu anjeun pasang:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Cara panggampangna pikeun pariksa versi Pandas nyaéta kieu:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

Ningkatkeun kasimpulan otomatis sareng DataFrame.info

Inovasi karesep kuring nyaéta pembaruan kana metodeu DataFrame.info. Fungsina janten langkung gampang dibaca, ngajantenkeun prosés eksplorasi data langkung gampang:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Outputting tabel dina format Markdown

Hiji inovasi sarua pikaresepeun nyaéta kamampuhan pikeun ngekspor dataframes kana tabel Markdown ngagunakeun DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Ieu ngagampangkeun nyebarkeun tabel dina situs sapertos Medium nganggo github gists.

Naon Pandas 1.0 dibawa ka kami

Jenis anyar pikeun senar sareng boolean

The Pandas 1.0 release ogé ditambahkeun anyar ékspérimén jenis. API maranéhanana masih bisa robah, jadi make eta kalawan caution. Tapi sacara umum, Pandas nyarankeun ngagunakeun jinis anyar dimana waé éta masuk akal.

Pikeun ayeuna, tuang kedah dilakukeun sacara eksplisit:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Perhatikeun kumaha kolom Dtype mintonkeun tipe anyar − tali и bool.

Fitur anu pang gunana tina jinis senar énggal nyaéta kamampuan pikeun milih ngan kolom baris ti dataframes. Ieu tiasa ngagampangkeun data téks parsing:

df.select_dtypes("string")

Saméméhna, kolom baris teu bisa dipilih tanpa sacara eksplisit nangtukeun ngaran.

Anjeun tiasa maca langkung seueur ngeunaan jinis énggal di dieu.

Hatur nuhun pikeun maca! Daptar lengkep parobahan, sakumaha geus disebutkeun, bisa ditempo di dieu.

sumber: www.habr.com

Tambahkeun komentar