ፓንዳስ 1.0 ምን አመጣን

ፓንዳስ 1.0 ምን አመጣን

Pandas 9rc በጥር 1.0.0 ተለቀቀ። የቤተ መፃህፍቱ የቀድሞ ስሪት 0.25 ነው.

የመጀመሪያው ዋና ልቀት የተሻሻለ የውሂብ ፍሬሞችን በራስ ሰር ማጠቃለልን፣ ብዙ የውጤት ቅርጸቶችን፣ አዲስ የውሂብ አይነቶችን እና አዲስ የሰነድ ጣቢያን ጨምሮ ብዙ ምርጥ ባህሪያትን ይዟል።

ሁሉም ለውጦች ሊታዩ ይችላሉ እዚህ, በአንቀጹ ውስጥ እራሳችንን በጣም አስፈላጊ በሆነው ትንሽ ትንሽ ቴክኒካዊ ግምገማ እንገድባለን.

እንደተለመደው ቤተ መፃህፍቱን መጫን ይችላሉ። PIPነገር ግን Pandas 1.0 በተፃፈበት ጊዜ አሁንም ድረስ ነው። የመልቀቅ እጩ, ስሪቱን በግልፅ መግለጽ ያስፈልግዎታል:

pip install --upgrade pandas==1.0.0rc0

ይጠንቀቁ፡ ዋና ልቀት ስለሆነ ዝማኔው የድሮውን ኮድ ሊሰብር ይችላል!

በነገራችን ላይ የ Python 2 ድጋፍ ከዚህ ስሪት ሙሉ በሙሉ ተትቷል (ጥሩ ምክንያት ምን ሊሆን ይችላል አዘምን - በግምት. ትርጉም). Pandas 1.0 ቢያንስ Python 3.6+ ይፈልጋል፣ ስለዚህ እርግጠኛ ካልሆኑ የትኛው እንዳለዎት ያረጋግጡ፡

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

የፓንዳስ ሥሪትን መፈተሽ በጣም ቀላል የሆነው እንደዚህ ነው።

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

በDataFrame.info የተሻሻለ AutoSum

የእኔ ተወዳጅ ፈጠራ ዘዴው ማዘመን ነበር። DataFrame.info. ተግባሩ የበለጠ ሊነበብ የሚችል ሆኗል፣ ይህም የውሂብ ማውጣት ሂደቱን የበለጠ ቀላል ያደርገዋል።

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

የሰንጠረዥ ውፅዓት በMarkdown ቅርጸት

እኩል የሆነ ጥሩ ፈጠራ የውሂብ ፍሬሞችን በመጠቀም ወደ ማርክዳው ሰንጠረዦች የመላክ ችሎታ ነበር። DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

ይህ github gistsን በመጠቀም እንደ መካከለኛ ባሉ ጣቢያዎች ላይ የህትመት ሰንጠረዦችን በእጅጉ ያቃልላል።

ፓንዳስ 1.0 ምን አመጣን

ለሕብረቁምፊዎች እና ቡሊያን አዲስ ዓይነቶች

የፓንዳስ 1.0 ልቀት እንዲሁ አዲስ ታክሏል። የሙከራ ዓይነቶች. የእነሱ ኤፒአይ አሁንም ሊለወጥ ይችላል፣ ስለዚህ በጥንቃቄ ይጠቀሙበት። ግን በአጠቃላይ ፓንዳስ ትርጉም በሚሰጥበት ቦታ ሁሉ አዳዲስ ዓይነቶችን እንዲጠቀሙ ይመክራል።

ለአሁን፣ ቀረጻው በግልፅ መደረግ አለበት፡-

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

ዓምዱ እንዴት እንደሆነ አስተውል dtype አዳዲስ ዓይነቶችን ያሳያል - ክር и ቦል.

የአዲሱ የሕብረቁምፊ አይነት በጣም ጠቃሚው ባህሪ የሚመረጥ ነው። የረድፍ ዓምዶች ብቻ ከዳታ ክፈፎች. ይህ የጽሑፍ ውሂብን መተንተንን በእጅጉ ያቃልላል፡-

df.select_dtypes("string")

ከዚህ ቀደም የረድፍ ዓምዶች ያለ ግልጽ ስሞች ሊመረጡ አይችሉም።

ስለ አዲሶቹ ዓይነቶች የበለጠ ማንበብ ይችላሉ እዚህ.

ስላነበቡ እናመሰግናለን! ሙሉው የለውጦች ዝርዝር, ቀደም ሲል እንደተጠቀሰው, ሊታይ ይችላል እዚህ.

ምንጭ: hab.com

አስተያየት ያክሉ