OpenNMT-tf (திறந்த நரம்பியல் இயந்திர மொழிபெயர்ப்பு) இயந்திர மொழிபெயர்ப்பு அமைப்பு, பதிப்பு 2.30.0, வெளியிடப்பட்டது. OpenNMT-tf திட்டத்தின் தொகுதிகள் பைத்தானில் எழுதப்பட்டுள்ளன, டென்சர்ஃப்ளோ நூலகத்தைப் பயன்படுத்துகின்றன, மேலும் MIT உரிமத்தின் கீழ் விநியோகிக்கப்படுகின்றன.
இணையாக, PyTorch-அடிப்படையிலான OpenNMT பதிப்பு உருவாக்கப்பட்டு வருகிறது, இது ஆதரிக்கும் அம்சங்களில் வேறுபடுகிறது. மேலும், PyTorch-அடிப்படையிலான OpenNMT பயன்படுத்த எளிதானது மற்றும் மல்டிமாடல் என விளம்பரப்படுத்தப்படுகிறது, அதே நேரத்தில் TensorFlow-அடிப்படையிலான பதிப்பு அதன் மட்டுப்படுத்தல், நிலைத்தன்மை மற்றும் நரம்பியல் நெட்வொர்க் பயிற்சியை துரிதப்படுத்த GPU திறன்களைப் பயன்படுத்தும் திறனுக்காகக் குறிப்பிடப்படுகிறது. விநியோகத்தை எளிதாக்க, இந்த திட்டம் கூடுதல் சார்புநிலைகள் தேவையில்லாமல் முன் பயிற்சி பெற்ற மாதிரிகளைப் பயன்படுத்தும் ஒரு தன்னிறைவான C++ மொழிபெயர்ப்பாளரான CTranslate2 ஐயும் உருவாக்கி வருகிறது.
ஆங்கிலம், ஜெர்மன் மற்றும் கேட்டலான் மொழிகளுக்கான மாதிரிகள் தயாரிக்கப்பட்டுள்ளன. பிற மொழிகளுக்கு, OPUS திட்டத்தின் தரவுத்தொகுப்பின் அடிப்படையில் உங்கள் சொந்த மாதிரியை உருவாக்கலாம் (பயிற்சிக்காக, அமைப்புக்கு இரண்டு கோப்புகள் வழங்கப்படுகின்றன - ஒன்று மூல மொழியில் வாக்கியங்களுடன், மற்றொன்று இந்த வாக்கியங்களை இலக்கு மொழியில் உயர்தர மொழிபெயர்ப்புடன்).
இயந்திர மொழிபெயர்ப்பு கருவிகளில் நிபுணத்துவம் பெற்ற நிறுவனமான SYSTRAN மற்றும் இயந்திர கற்றல் அமைப்புகளுக்கான மனித மொழி மாதிரிகளை உருவாக்கும் ஹார்வர்ட் ஆராய்ச்சியாளர்கள் குழுவின் பங்கேற்புடன் இந்த திட்டம் உருவாக்கப்படுகிறது. பயனர் இடைமுகம் மிகவும் எளிமைப்படுத்தப்பட்டுள்ளது, உள்ளீட்டு உரை கோப்பு மற்றும் அதன் விளைவாக வரும் கோப்பு மட்டுமே சேமிக்கப்பட வேண்டும். ஒரு நீட்டிப்பு அமைப்பு OpenNMT இன் மேல் தானியங்கி சுருக்கம், உரை வகைப்பாடு மற்றும் வசன வரிகள் போன்ற கூடுதல் செயல்பாடுகளை செயல்படுத்த அனுமதிக்கிறது.
புதிய பதிப்பில்:
- TensorFlow 2.11 நூலகத்திற்கான ஆதரவு சேர்க்கப்பட்டுள்ளது, ஆனால் புதிய Keras உகப்பாக்கிகள் இன்னும் ஆதரிக்கப்படவில்லை (tf.keras.optimizers.legacy பயன்முறையைப் பயன்படுத்த வேண்டும்).
- "டிரான்ஸ்ஃபார்மர்" கட்டமைப்பைக் கொண்ட மாடல்களை திறம்பட செயல்படுத்துவதற்காக வடிவமைக்கப்பட்ட CTranslate2 3.x எஞ்சினின் புதிய கிளைக்கான ஆதரவு சேர்க்கப்பட்டது.
- பக்கெட் அளவை நீளம்_பக்கெட்_அகலத்தின் மடங்குகளுக்கு சீரமைக்கும் கூடுதல் பேடிங்கை இயக்க, pad_to_bucket_boundary மாதிரி பயிற்சி அளவுருவைச் சேர்த்துள்ளோம்.
- SacreBLEU திட்டத்திலிருந்து chrf மற்றும் chrf++ அளவீடுகளுக்கான ஒருங்கிணைந்த ஆதரவு, இது இயந்திர மொழிபெயர்ப்பை குறிப்பு மனித மொழிபெயர்ப்புடன் ஒப்பிடுகிறது.
- CTranslate2_spec மாதிரி பண்புக்கூறு நீக்கப்பட்டது, இது இனி CTranslate2 இல் பயன்படுத்தப்படவில்லை.
ஆதாரம்: opennet.ru
