ڇا پانڊاس 1.0 اسان کي آندو

ڇا پانڊاس 1.0 اسان کي آندو

9 جنوري تي، پانڊاس 1.0.0rc جاري ڪئي وئي. لائبريري جو اڳوڻو نسخو 0.25 آهي.

پهرين وڏي رليز ۾ ڪيتريون ئي وڏيون نيون خاصيتون شامل آهن، جن ۾ بهتر خودڪار ڊيٽا فريم اختصار، وڌيڪ آئوٽ پٽ فارميٽ، نئين ڊيٽا جا قسم، ۽ حتي هڪ نئين دستاويزي سائيٽ.

سڀ تبديليون ڏسي سگهجن ٿيون هتي، مضمون ۾ اسين پاڻ کي محدود ڪنداسين، ننڍڙي، گهٽ ٽيڪنيڪل جائزي جي سڀ کان اهم شين جي.

توھان عام طور تي استعمال ڪندي لائبريري کي انسٽال ڪري سگھو ٿا pip، پر لکڻ جي وقت کان وٺي پانڊاس 1.0 اڃا تائين آهي اميدوار ڇڏڻ، توهان کي واضح طور تي نسخو بيان ڪرڻ جي ضرورت پوندي:

pip install --upgrade pandas==1.0.0rc0

محتاط رھو: ڇاڪاڻ ته اھو ھڪڙو وڏو رليز آھي، اپڊيٽ شايد پراڻي ڪوڊ کي ٽوڙي سگھي ٿو!

رستي جي ذريعي، پٿون 2 لاءِ سپورٽ مڪمل طور تي بند ڪئي وئي آهي هن نسخي کان (ڇا هڪ سٺو سبب ٿي سگهي ٿو تازه ڪاري - لڳ ڀڳ ترجمو). پانڊاس 1.0 کي گهٽ ۾ گهٽ پٿون 3.6+ جي ضرورت آهي، تنهن ڪري جيڪڏهن توهان پڪ نه آهيو، چيڪ ڪريو ته توهان ڪهڙو نصب ڪيو آهي:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

پانڊاس ورزن کي چيڪ ڪرڻ جو آسان طريقو هي آهي:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info سان بهتر خودڪار اختصار

منهنجي پسنديده جدت طريقي جي تازه ڪاري هئي DataFrame.info. فنڪشن گهڻو وڌيڪ پڙهڻ لائق ٿي چڪو آهي، ڊيٽا جي ڳولا جي عمل کي اڃا به آسان بڻائي ٿو:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

مارڪ ڊائون فارميٽ ۾ جدولن کي ٻاھر ڪڍڻ

هڪ جيتري خوشگوار جدت آهي ڊيٽا فريم کي برآمد ڪرڻ جي صلاحيت مارڪ ڊائون ٽيبل تي استعمال ڪندي DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

اهو انهي کي آسان بڻائي ٿو سائيٽن تي جدولن کي شايع ڪرڻ جهڙوڪ ميڊيم استعمال ڪندي github gists.

ڇا پانڊاس 1.0 اسان کي آندو

تارن ۽ بولن لاءِ نوان قسم

پانڊاس 1.0 رليز پڻ نئون شامل ڪيو تجرباتي قسمون. انهن جي API اڃا به تبديل ٿي سگهي ٿي، تنهنڪري ان کي احتياط سان استعمال ڪريو. پر عام طور تي، پانڊا نئين قسمن کي استعمال ڪرڻ جي صلاح ڏين ٿا جتي اهو احساس ٿئي ٿو.

في الحال، ڪاسٽ کي واضح طور تي ڪرڻ جي ضرورت آهي:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

نوٽ ڪريو ڪالم ڪيئن ڊي قسم ڏيکاري ٿو نوان قسم - جملو и ڪتو.

نئين اسٽرنگ قسم جي سڀ کان وڌيڪ مفيد خصوصيت چونڊڻ جي صلاحيت آهي صرف قطار ڪالمن ڊيٽا فريم مان. هي ٽيڪسٽ ڊيٽا کي گهڻو آسان بڻائي سگھي ٿو:

df.select_dtypes("string")

اڳي، قطار ڪالمن کي واضح طور تي نالن جي وضاحت ڪرڻ کان سواء منتخب نه ٿي سگهيو.

توھان وڌيڪ پڙھي سگھوٿا نون قسمن بابت هتي.

پڙهڻ لاء توهان جي مهرباني! تبديلين جي مڪمل فهرست، جيئن اڳ ۾ ئي ذڪر ڪيو ويو آهي، ڏسي سگھجي ٿو هتي.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو