ජනවාරි 9 වන දින, Pandas 1.0.0rc නිකුත් කරන ලදී. පුස්තකාලයේ පෙර අනුවාදය 0.25 වේ.
පළමු ප්රධාන නිකුතුවේ වැඩිදියුණු කළ ස්වයංක්රීය දත්ත රාමු සාරාංශ කිරීම, වැඩි ප්රතිදාන ආකෘති, නව දත්ත වර්ග, සහ නව ලේඛන වෙබ් අඩවියක් ඇතුළු බොහෝ නව විශේෂාංග අඩංගු වේ.
සියලුම වෙනස්කම් නැරඹිය හැකිය
ඔබට සුපුරුදු පරිදි පුස්තකාලය ස්ථාපනය කළ හැකිය එක පිප්ස් එකකට, නමුත් Pandas 1.0 ලියන අවස්ථාවේ සිට තවමත් අපේක්ෂකයා නිදහස් කරන්න, ඔබට අනුවාදය පැහැදිලිව සඳහන් කිරීමට අවශ්ය වනු ඇත:
pip install --upgrade pandas==1.0.0rc0
ප්රවේශම් වන්න: මෙය ප්රධාන නිකුතුවක් බැවින්, යාවත්කාලීනය පැරණි කේතය බිඳ දැමිය හැක!
මාර්ගය වන විට, මෙම අනුවාදයේ සිට Python 2 සඳහා සහය සම්පූර්ණයෙන්ම නතර කර ඇත (හොඳ හේතුවක් විය හැක්කේ කුමක් ද?
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Pandas අනුවාදය පරීක්ෂා කිරීමට පහසුම ක්රමය මෙයයි:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info සමඟින් වැඩි දියුණු කළ ස්වයං සාරාංශගත කිරීම
මගේ ප්රියතම නවෝත්පාදනය වූයේ ක්රමයට යාවත්කාලීන කිරීමයි DataFrame.info. දත්ත ගවේෂණ ක්රියාවලිය වඩාත් පහසු කරමින් ශ්රිතය වඩාත් කියවිය හැකි වී ඇත:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
මාර්ක්ඩවුන් ආකෘතියෙන් වගු ප්රතිදානය කිරීම
ඒ හා සමානව ප්රසන්න නවෝත්පාදනයක් වන්නේ දත්ත රාමු භාවිතා කරමින් Markdown වගු වෙත අපනයනය කිරීමේ හැකියාවයි DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
මෙය github gists භාවිතයෙන් Medium වැනි අඩවි වල වගු ප්රකාශනය කිරීම වඩාත් පහසු කරයි.
නූල් සහ බූලියන් සඳහා නව වර්ග
Pandas 1.0 නිකුතුව ද නව එකතු කරන ලදී පර්යේෂණාත්මක වර්ග. ඔවුන්ගේ API තවමත් වෙනස් විය හැක, එබැවින් එය ප්රවේශමෙන් භාවිතා කරන්න. නමුත් පොදුවේ, Pandas එය අර්ථවත් වන ඕනෑම තැනක නව වර්ග භාවිතා කිරීම නිර්දේශ කරයි.
දැනට, රංගනය පැහැදිලිවම කළ යුතුය:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
තීරුවේ ආකාරය සැලකිල්ලට ගන්න Dtype නව වර්ග පෙන්වයි - පේළියකි и bool.
නව තන්තු වර්ගයෙහි වඩාත් ප්රයෝජනවත් ලක්ෂණය වන්නේ තේරීමේ හැකියාවයි පේළි තීරු පමණි දත්ත රාමු වලින්. මෙය පෙළ දත්ත විග්රහ කිරීම වඩාත් පහසු කරයි:
df.select_dtypes("string")
මින් පෙර, පැහැදිලිව නම් සඳහන් නොකර පේළි තීරු තෝරාගත නොහැක.
ඔබට නව වර්ග ගැන වැඩිදුර කියවිය හැකිය
කියවීමට ස්තූතියි! දැනටමත් සඳහන් කර ඇති පරිදි සම්පූර්ණ වෙනස්කම් ලැයිස්තුව නැරඹිය හැකිය
මූලාශ්රය: www.habr.com