Pandas 1.0 бидэнд юу авчирсан

Pandas 1.0 бидэнд юу авчирсан

9-р сарын 1.0.0-нд Pandas 0.25rc гарсан. Номын сангийн өмнөх хувилбар нь XNUMX.

Эхний томоохон хувилбар нь сайжруулсан автомат өгөгдлийн хүрээ, илүү олон гаралтын формат, шинэ өгөгдлийн төрлүүд, тэр ч байтугай шинэ баримт бичгийн сайт зэрэг олон гайхалтай шинэ боломжуудыг агуулдаг.

Бүх өөрчлөлтийг харах боломжтой энд, нийтлэлд бид хамгийн чухал зүйлсийн талаар бага, бага техникийн тоймоор өөрсдийгөө хязгаарлах болно.

Та номын санг ердийнхөөрөө суулгаж болно PIP, гэхдээ бичиж байх үед Pandas 1.0 хэвээр байна нэр дэвшигчийг суллах, та хувилбарыг тодорхой зааж өгөх хэрэгтэй:

pip install --upgrade pandas==1.0.0rc0

Болгоомжтой байгаарай: энэ нь томоохон хувилбар тул шинэчлэлт нь хуучин кодыг эвдэж болзошгүй!

Дашрамд хэлэхэд, Python 2-ийн дэмжлэг энэ хувилбараас хойш бүрэн зогссон (ямар сайн шалтгаан байж болох вэ шинэчлэх - ойролцоогоор. орчуулга). Pandas 1.0 нь хамгийн багадаа Python 3.6+ шаарддаг тул хэрэв та итгэлгүй байгаа бол алийг нь суулгасанаа шалгана уу:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Pandas хувилбарыг шалгах хамгийн хялбар арга бол:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info ашиглан автоматаар хураангуйг сайжруулсан

Миний дуртай шинэлэг зүйл бол аргын шинэчлэл байсан DataFrame.info. Функц нь илүү уншигдахуйц болж, өгөгдөл хайх үйл явцыг илүү хялбар болгосон:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

Markdown форматаар хүснэгтүүдийг гаргаж байна

Үүнтэй адил таатай шинэлэг зүйл бол дата фреймүүдийг Markdown хүснэгтэд экспортлох чадвар юм DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

Энэ нь github gists ашиглан Medium гэх мэт сайтууд дээр хүснэгт нийтлэхэд илүү хялбар болгодог.

Pandas 1.0 бидэнд юу авчирсан

Мөр болон булины шинэ төрлүүд

Pandas 1.0 хувилбар нь мөн шинээр нэмэгдсэн туршилтын төрөл. Тэдний API өөрчлөгдөж магадгүй тул үүнийг болгоомжтой ашиглаарай. Гэхдээ ерөнхийдөө Pandas шинэ төрлийг хаана ч хамаагүй ашиглахыг зөвлөж байна.

Одоогоор дүрд тоглох ажлыг тодорхой хийх шаардлагатай байна:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

Багана хэрхэн байгааг анзаараарай D төрөл шинэ төрлүүдийг харуулна − мөр и bool.

Шинэ string төрлийн хамгийн ашигтай шинж чанар нь сонгох чадвар юм зөвхөн мөр багана дата фреймээс. Энэ нь текст өгөгдлийг задлан шинжлэхийг илүү хялбар болгож чадна:

df.select_dtypes("string")

Өмнө нь нэрийг тодорхой зааж өгөхгүйгээр мөрийн баганыг сонгох боломжгүй байсан.

Та шинэ төрлүүдийн талаар илүү ихийг уншиж болно энд.

Уншсанд баярлалаа! Өмнө дурьдсанчлан өөрчлөлтүүдийн бүрэн жагсаалтыг үзэх боломжтой энд.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх