ဇန်နဝါရီလ 9 ရက်နေ့တွင် Pandas 1.0.0rc ထွက်ရှိခဲ့သည်။ စာကြည့်တိုက်၏ ယခင်ဗားရှင်းမှာ 0.25 ဖြစ်သည်။
ပထမအကြိမ်ထုတ်လွှတ်မှုတွင် ပိုမိုကောင်းမွန်သော အလိုအလျောက်ဒေတာဘောင်အကျဉ်းချုပ်၊ ထုတ်ပေးသည့်ဖော်မတ်များ၊ ဒေတာအမျိုးအစားအသစ်များနှင့် စာရွက်စာတမ်းဆိုက်အသစ်များအပါအဝင် ကောင်းမွန်သောအင်္ဂါရပ်များစွာပါရှိသည်။
ပြောင်းလဲမှုအားလုံးကို ကြည့်ရှုနိုင်ပါသည်။
ပုံမှန်အတိုင်း အသုံးပြု၍ စာကြည့်တိုက်ကို တပ်ဆင်နိုင်သည်။ PIPဒါပေမယ့် Pandas 1.0 ရေးတဲ့ အချိန်ကစလို့ အခုထိပါပဲ။ ကိုယ်စားလှယ်လောင်းကိုလွှတ်ပေးပါဗားရှင်းကို အတိအလင်း သတ်မှတ်ရန် လိုအပ်ပါမည်-
pip install --upgrade pandas==1.0.0rc0
သတိထားပါ- ၎င်းသည် အကြီးစားထုတ်ဝေမှုဖြစ်သောကြောင့်၊ အပ်ဒိတ်သည် ကုဒ်ဟောင်းကို ချိုးဖျက်နိုင်သည်။
စကားမစပ်၊ ဤဗားရှင်းမှစ၍ Python 2 အတွက် ပံ့ပိုးမှု လုံးဝရပ်ဆိုင်းသွားသည် (ဘာအကြောင်းပြချက်ကောင်းရှိနိုင်မလဲ။
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
Pandas ဗားရှင်းကို စစ်ဆေးရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info ဖြင့် အလိုအလျောက် အကျဉ်းချုပ်ကို မြှင့်တင်ထားသည်။
ကျွန်ုပ်အနှစ်သက်ဆုံး ဆန်းသစ်တီထွင်မှုသည် နည်းလမ်းအတွက် အပ်ဒိတ်ဖြစ်သည်။ DataFrame.info. လုပ်ဆောင်ချက်သည် ပိုမိုဖတ်ရှုနိုင်လာပြီး ဒေတာရှာဖွေရေးလုပ်ငန်းစဉ်ကို ပိုမိုလွယ်ကူစေသည်-
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
Markdown ဖော်မတ်ဖြင့် ဇယားများကို ထုတ်ခြင်း။
ထပ်တူထပ်မျှ ကြည်နူးစရာကောင်းသော ဆန်းသစ်တီထွင်မှုသည် Markdown ဇယားများကို အသုံးပြု၍ ဒေတာဘောင်များကို တင်ပို့နိုင်မှုဖြစ်သည်။ DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
၎င်းသည် github gists ကို အသုံးပြု၍ Medium ကဲ့သို့သော ဆိုက်များတွင် ဇယားများကို ထုတ်ဝေရန် ပိုမိုလွယ်ကူစေသည်။
ကြိုးများနှင့် ဘူလီယံများအတွက် အမျိုးအစားအသစ်များ
Pandas 1.0 ထွက်ရှိမှုမှာလည်း အသစ်ထပ်ထည့်ထားပါတယ်။ စမ်းသပ်မှု အမျိုးအစားများ။ ၎င်းတို့၏ API သည် ပြောင်းလဲဆဲဖြစ်နိုင်သောကြောင့် ၎င်းကို သတိဖြင့်အသုံးပြုပါ။ သို့သော် ယေဘုယျအားဖြင့်၊ Pandas သည် အဓိပ္ပါယ်ရှိသည့်နေရာတိုင်းတွင် အမျိုးအစားအသစ်များကို အသုံးပြုရန် အကြံပြုထားသည်။
ယခုအချိန်တွင် သရုပ်ဖော်မှုကို ပြတ်သားစွာ လုပ်ဆောင်ရန် လိုအပ်သည်-
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
ကော်လံကို ဘယ်လိုမြင်လဲ။ Dtype အမျိုးအစားအသစ်များကိုပြသသည် - ကြိုး и ဘူလ်.
ကြိုးအမျိုးအစားအသစ်၏ အသုံးဝင်ဆုံးအင်္ဂါရပ်မှာ ရွေးချယ်နိုင်မှုဖြစ်သည်။ အတန်း ကော်လံများသာ dataframes မှ ၎င်းက စာသားဒေတာကို ခွဲခြမ်းစိတ်ဖြာရာတွင် ပိုမိုလွယ်ကူစေနိုင်သည်။
df.select_dtypes("string")
ယခင်က အမည်များကို အတိအကျမသတ်မှတ်ဘဲ အတန်းကော်လံများကို ရွေး၍မရပါ။
အမျိုးအစားအသစ်များအကြောင်း ပိုမိုဖတ်ရှုနိုင်ပါသည်။
ဖတ်ရှုခြင်းအတွက် ကျေးဇူးတင်ပါသည်။ ဖော်ပြပြီးသား အပြောင်းအလဲများစာရင်း အပြည့်အစုံကို ကြည့်ရှုနိုင်ပါသည်။
source: www.habr.com