Pandas 1.0 бізге не әкелді

Pandas 1.0 бізге не әкелді

9 қаңтарда Pandas 1.0.0rc шығарылды. Кітапхананың алдыңғы нұсқасы 0.25.

Бірінші негізгі шығарылымда көптеген тамаша жаңа мүмкіндіктер бар, соның ішінде жақсартылған автоматты деректер қортындысы, көбірек шығыс пішімдері, жаңа деректер түрлері және тіпті жаңа құжаттама сайты.

Барлық өзгерістерді көруге болады осында, мақалада біз ең маңызды нәрселерге шағын, аз техникалық шолумен шектелеміз.

Кітапхананы әдеттегідей пайдалана отырып орнатуға болады PIP, бірақ Pandas 1.0 жазу кезінде әлі де бар кандидатты босату, нұсқаны нақты көрсетуіңіз керек:

pip install --upgrade pandas==1.0.0rc0

Сақ болыңыз: бұл негізгі шығарылым болғандықтан, жаңарту ескі кодты бұзуы мүмкін!

Айтпақшы, осы нұсқадан бері Python 2 қолдауы толығымен тоқтатылды (қандай жақсы себеп болуы мүмкін жаңарту — шамамен. аударма). Pandas 1.0 кем дегенде Python 3.6+ нұсқасын қажет етеді, сондықтан сенімді болмасаңыз, қайсысын орнатқаныңызды тексеріңіз:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Pandas нұсқасын тексерудің ең оңай жолы мынада:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info көмегімен жақсартылған автоматты қорытындылау

Менің сүйікті жаңалығым әдісті жаңарту болды DataFrame.info. Функция әлдеқайда оқылатын болды, бұл деректерді зерттеу процесін одан да жеңілдетеді:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Markdown форматында кестелерді шығару

Бірдей жағымды жаңалық - деректер фреймдерін Markdown кестелеріне экспорттау мүмкіндігі DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Бұл Github Gists көмегімен Medium сияқты сайттарда кестелерді жариялауды әлдеқайда жеңілдетеді.

Pandas 1.0 бізге не әкелді

Жолдар мен логикалықтардың жаңа түрлері

Pandas 1.0 шығарылымы да жаңа қосылды эксперименттік түрлері. Олардың API әлі де өзгеруі мүмкін, сондықтан оны сақтықпен пайдаланыңыз. Бірақ жалпы алғанда, Pandas мағынасы бар жерде жаңа түрлерді пайдалануды ұсынады.

Әзірге актерлік жұмысты нақты орындау керек:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Бағананың қалай екеніне назар аударыңыз Dтүрі жаңа түрлерін көрсетеді − жол и буль.

Жаңа жол түрінің ең пайдалы қасиеті - таңдау мүмкіндігі тек жол бағандары деректер фреймдерінен. Бұл мәтіндік деректерді талдауды әлдеқайда жеңілдетеді:

df.select_dtypes("string")

Бұрын жол бағандарын атауларды нақты көрсетпей таңдау мүмкін емес еді.

Жаңа түрлер туралы көбірек оқи аласыз осында.

Оқығаныңызға рахмет! Өзгерістердің толық тізімін, жоғарыда айтылғандай, көруге болады осында.

Ақпарат көзі: www.habr.com

пікір қалдыру