9 جنوری کو، پانڈاس 1.0.0rc جاری کیا گیا۔ لائبریری کا پچھلا ورژن 0.25 ہے۔
پہلی بڑی ریلیز میں بہت ساری نئی خصوصیات شامل ہیں، بشمول بہتر خودکار ڈیٹا فریم کا خلاصہ، مزید آؤٹ پٹ فارمیٹس، ڈیٹا کی نئی اقسام، اور یہاں تک کہ ایک نئی دستاویزی سائٹ۔
تمام تبدیلیاں دیکھی جا سکتی ہیں۔
آپ لائبریری کو معمول کے مطابق استعمال کر کے انسٹال کر سکتے ہیں۔ PIP، لیکن چونکہ پانڈا 1.0 لکھنے کے وقت اب بھی ہے۔ رہائی کے امیدوار، آپ کو واضح طور پر ورژن کی وضاحت کرنے کی ضرورت ہوگی:
pip install --upgrade pandas==1.0.0rc0
ہوشیار رہیں: چونکہ یہ ایک بڑی ریلیز ہے، اس لیے اپ ڈیٹ پرانے کوڈ کو توڑ سکتا ہے!
ویسے، اس ورژن کے بعد سے Python 2 کی سپورٹ مکمل طور پر بند کر دی گئی ہے۔ایک اچھی وجہ کیا ہو سکتی ہے
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
پانڈاس ورژن کو چیک کرنے کا سب سے آسان طریقہ یہ ہے:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info کے ساتھ بہتر خودکار خلاصہ
میری پسندیدہ جدت طریقہ کی تازہ کاری تھی۔ DataFrame.info. فنکشن بہت زیادہ پڑھنے کے قابل ہو گیا ہے، جس سے ڈیٹا کی تلاش کا عمل اور بھی آسان ہو گیا ہے:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
مارک ڈاون فارمیٹ میں آؤٹ پٹ ٹیبلز
یکساں طور پر خوشگوار اختراع یہ ہے کہ ڈیٹا فریم کو مارک ڈاون ٹیبلز پر ایکسپورٹ کرنے کی صلاحیت DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
اس سے گیتھب گسٹ کا استعمال کرتے ہوئے میڈیم جیسی سائٹوں پر ٹیبل شائع کرنا بہت آسان ہوجاتا ہے۔
تاروں اور بولین کے لیے نئی اقسام
پانڈاس 1.0 ریلیز نے بھی نیا اضافہ کیا۔ تجرباتی اقسام ان کا API اب بھی تبدیل ہو سکتا ہے، لہذا اسے احتیاط کے ساتھ استعمال کریں۔ لیکن عام طور پر، پانڈاس تجویز کرتے ہیں کہ نئی قسمیں استعمال کریں جہاں یہ سمجھ میں آتا ہے۔
ابھی کے لیے، کاسٹ کو واضح طور پر کرنے کی ضرورت ہے:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
کالم کس طرح نوٹس ٹائپ نئی اقسام دکھاتا ہے۔ سٹرنگ и بول.
نئی سٹرنگ ٹائپ کی سب سے مفید خصوصیت سلیکٹ ایبلٹی ہے۔ صرف قطار کے کالم ڈیٹا فریم سے یہ ٹیکسٹ ڈیٹا کو پارس کرنا بہت آسان بنا سکتا ہے:
df.select_dtypes("string")
پہلے، واضح طور پر نام بتائے بغیر قطار کے کالم منتخب نہیں کیے جا سکتے تھے۔
آپ نئی اقسام کے بارے میں مزید پڑھ سکتے ہیں۔
پڑھنے کے لیے آپ کا شکریہ! تبدیلیوں کی مکمل فہرست، جیسا کہ پہلے ہی ذکر کیا گیا ہے، دیکھا جا سکتا ہے۔
ماخذ: www.habr.com