9 қаңтарда Pandas 1.0.0rc шығарылды. Кітапхананың алдыңғы нұсқасы 0.25.
Бірінші негізгі шығарылымда көптеген тамаша жаңа мүмкіндіктер бар, соның ішінде жақсартылған автоматты деректер қортындысы, көбірек шығыс пішімдері, жаңа деректер түрлері және тіпті жаңа құжаттама сайты.
Барлық өзгерістерді көруге болады
Кітапхананы әдеттегідей пайдалана отырып орнатуға болады PIP, бірақ Pandas 1.0 жазу кезінде әлі де бар кандидатты босату, нұсқаны нақты көрсетуіңіз керек:
pip install --upgrade pandas==1.0.0rc0
Сақ болыңыз: бұл негізгі шығарылым болғандықтан, жаңарту ескі кодты бұзуы мүмкін!
Айтпақшы, осы нұсқадан бері Python 2 қолдауы толығымен тоқтатылды (қандай жақсы себеп болуы мүмкін
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Pandas нұсқасын тексерудің ең оңай жолы мынада:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info көмегімен жақсартылған автоматты қорытындылау
Менің сүйікті жаңалығым әдісті жаңарту болды DataFrame.info. Функция әлдеқайда оқылатын болды, бұл деректерді зерттеу процесін одан да жеңілдетеді:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
Markdown форматында кестелерді шығару
Бірдей жағымды жаңалық - деректер фреймдерін Markdown кестелеріне экспорттау мүмкіндігі DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
Бұл Github Gists көмегімен Medium сияқты сайттарда кестелерді жариялауды әлдеқайда жеңілдетеді.
Жолдар мен логикалықтардың жаңа түрлері
Pandas 1.0 шығарылымы да жаңа қосылды эксперименттік түрлері. Олардың API әлі де өзгеруі мүмкін, сондықтан оны сақтықпен пайдаланыңыз. Бірақ жалпы алғанда, Pandas мағынасы бар жерде жаңа түрлерді пайдалануды ұсынады.
Әзірге актерлік жұмысты нақты орындау керек:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
Бағананың қалай екеніне назар аударыңыз Dтүрі жаңа түрлерін көрсетеді − жол и буль.
Жаңа жол түрінің ең пайдалы қасиеті - таңдау мүмкіндігі тек жол бағандары деректер фреймдерінен. Бұл мәтіндік деректерді талдауды әлдеқайда жеңілдетеді:
df.select_dtypes("string")
Бұрын жол бағандарын атауларды нақты көрсетпей таңдау мүмкін емес еді.
Жаңа түрлер туралы көбірек оқи аласыз
Оқығаныңызға рахмет! Өзгерістердің толық тізімін, жоғарыда айтылғандай, көруге болады
Ақпарат көзі: www.habr.com