Pandas 1.0 අපට ගෙනා දේ

Pandas 1.0 අපට ගෙනා දේ

ජනවාරි 9 වන දින, Pandas 1.0.0rc නිකුත් කරන ලදී. පුස්තකාලයේ පෙර අනුවාදය 0.25 වේ.

පළමු ප්‍රධාන නිකුතුවේ වැඩිදියුණු කළ ස්වයංක්‍රීය දත්ත රාමු සාරාංශ කිරීම, වැඩි ප්‍රතිදාන ආකෘති, නව දත්ත වර්ග, සහ නව ලේඛන වෙබ් අඩවියක් ඇතුළු බොහෝ නව විශේෂාංග අඩංගු වේ.

සියලුම වෙනස්කම් නැරඹිය හැකිය මෙහි, ලිපියෙන් අපි වඩාත් වැදගත් දේ පිළිබඳ කුඩා, අඩු තාක්ෂණික සමාලෝචනයකට සීමා කරමු.

ඔබට සුපුරුදු පරිදි පුස්තකාලය ස්ථාපනය කළ හැකිය එක පිප්ස් එකකට, නමුත් Pandas 1.0 ලියන අවස්ථාවේ සිට තවමත් අපේක්ෂකයා නිදහස් කරන්න, ඔබට අනුවාදය පැහැදිලිව සඳහන් කිරීමට අවශ්‍ය වනු ඇත:

pip install --upgrade pandas==1.0.0rc0

ප්‍රවේශම් වන්න: මෙය ප්‍රධාන නිකුතුවක් බැවින්, යාවත්කාලීනය පැරණි කේතය බිඳ දැමිය හැක!

මාර්ගය වන විට, මෙම අනුවාදයේ සිට Python 2 සඳහා සහය සම්පූර්ණයෙන්ම නතර කර ඇත (හොඳ හේතුවක් විය හැක්කේ කුමක් ද? යාවත්කාලීන - ආසන්න වශයෙන්. පරිවර්තනය) Pandas 1.0 සඳහා අවම වශයෙන් Python 3.6+ අවශ්‍ය වේ, එබැවින් ඔබට විශ්වාස නැතිනම්, ඔබ ස්ථාපනය කර ඇත්තේ කුමක්දැයි පරීක්ෂා කරන්න:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

Pandas අනුවාදය පරීක්ෂා කිරීමට පහසුම ක්රමය මෙයයි:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info සමඟින් වැඩි දියුණු කළ ස්වයං සාරාංශගත කිරීම

මගේ ප්‍රියතම නවෝත්පාදනය වූයේ ක්‍රමයට යාවත්කාලීන කිරීමයි DataFrame.info. දත්ත ගවේෂණ ක්‍රියාවලිය වඩාත් පහසු කරමින් ශ්‍රිතය වඩාත් කියවිය හැකි වී ඇත:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

මාර්ක්ඩවුන් ආකෘතියෙන් වගු ප්‍රතිදානය කිරීම

ඒ හා සමානව ප්‍රසන්න නවෝත්පාදනයක් වන්නේ දත්ත රාමු භාවිතා කරමින් Markdown වගු වෙත අපනයනය කිරීමේ හැකියාවයි DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

මෙය github gists භාවිතයෙන් Medium වැනි අඩවි වල වගු ප්‍රකාශනය කිරීම වඩාත් පහසු කරයි.

Pandas 1.0 අපට ගෙනා දේ

නූල් සහ බූලියන් සඳහා නව වර්ග

Pandas 1.0 නිකුතුව ද නව එකතු කරන ලදී පර්යේෂණාත්මක වර්ග. ඔවුන්ගේ API තවමත් වෙනස් විය හැක, එබැවින් එය ප්‍රවේශමෙන් භාවිතා කරන්න. නමුත් පොදුවේ, Pandas එය අර්ථවත් වන ඕනෑම තැනක නව වර්ග භාවිතා කිරීම නිර්දේශ කරයි.

දැනට, රංගනය පැහැදිලිවම කළ යුතුය:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

තීරුවේ ආකාරය සැලකිල්ලට ගන්න Dtype නව වර්ග පෙන්වයි - පේළියකි и bool.

නව තන්තු වර්ගයෙහි වඩාත් ප්රයෝජනවත් ලක්ෂණය වන්නේ තේරීමේ හැකියාවයි පේළි තීරු පමණි දත්ත රාමු වලින්. මෙය පෙළ දත්ත විග්‍රහ කිරීම වඩාත් පහසු කරයි:

df.select_dtypes("string")

මින් පෙර, පැහැදිලිව නම් සඳහන් නොකර පේළි තීරු තෝරාගත නොහැක.

ඔබට නව වර්ග ගැන වැඩිදුර කියවිය හැකිය මෙහි.

කියවීමට ස්තූතියි! දැනටමත් සඳහන් කර ඇති පරිදි සම්පූර්ණ වෙනස්කම් ලැයිස්තුව නැරඹිය හැකිය මෙහි.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න