9-р сарын 1.0.0-нд Pandas 0.25rc гарсан. Номын сангийн өмнөх хувилбар нь XNUMX.
Эхний томоохон хувилбар нь сайжруулсан автомат өгөгдлийн хүрээ, илүү олон гаралтын формат, шинэ өгөгдлийн төрлүүд, тэр ч байтугай шинэ баримт бичгийн сайт зэрэг олон гайхалтай шинэ боломжуудыг агуулдаг.
Бүх өөрчлөлтийг харах боломжтой
Та номын санг ердийнхөөрөө суулгаж болно PIP, гэхдээ бичиж байх үед Pandas 1.0 хэвээр байна нэр дэвшигчийг суллах, та хувилбарыг тодорхой зааж өгөх хэрэгтэй:
pip install --upgrade pandas==1.0.0rc0
Болгоомжтой байгаарай: энэ нь томоохон хувилбар тул шинэчлэлт нь хуучин кодыг эвдэж болзошгүй!
Дашрамд хэлэхэд, Python 2-ийн дэмжлэг энэ хувилбараас хойш бүрэн зогссон (ямар сайн шалтгаан байж болох вэ
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Pandas хувилбарыг шалгах хамгийн хялбар арга бол:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info ашиглан автоматаар хураангуйг сайжруулсан
Миний дуртай шинэлэг зүйл бол аргын шинэчлэл байсан DataFrame.info. Функц нь илүү уншигдахуйц болж, өгөгдөл хайх үйл явцыг илүү хялбар болгосон:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
Markdown форматаар хүснэгтүүдийг гаргаж байна
Үүнтэй адил таатай шинэлэг зүйл бол дата фреймүүдийг Markdown хүснэгтэд экспортлох чадвар юм DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
Энэ нь github gists ашиглан Medium гэх мэт сайтууд дээр хүснэгт нийтлэхэд илүү хялбар болгодог.
Мөр болон булины шинэ төрлүүд
Pandas 1.0 хувилбар нь мөн шинээр нэмэгдсэн туршилтын төрөл. Тэдний API өөрчлөгдөж магадгүй тул үүнийг болгоомжтой ашиглаарай. Гэхдээ ерөнхийдөө Pandas шинэ төрлийг хаана ч хамаагүй ашиглахыг зөвлөж байна.
Одоогоор дүрд тоглох ажлыг тодорхой хийх шаардлагатай байна:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
Багана хэрхэн байгааг анзаараарай D төрөл шинэ төрлүүдийг харуулна − мөр и bool.
Шинэ string төрлийн хамгийн ашигтай шинж чанар нь сонгох чадвар юм зөвхөн мөр багана дата фреймээс. Энэ нь текст өгөгдлийг задлан шинжлэхийг илүү хялбар болгож чадна:
df.select_dtypes("string")
Өмнө нь нэрийг тодорхой зааж өгөхгүйгээр мөрийн баганыг сонгох боломжгүй байсан.
Та шинэ төрлүүдийн талаар илүү ихийг уншиж болно
Уншсанд баярлалаа! Өмнө дурьдсанчлан өөрчлөлтүүдийн бүрэн жагсаалтыг үзэх боломжтой
Эх сурвалж: www.habr.com