神鷹現在是由這樣的計算環境的兩個技術和社會學挑戰的影響,
神鷹團隊已建立驚人的工具,使科學家和工程師,以提高他們的計算吞吐量
什麼在此版本中是新的:
- < LI> 7.6.X是新的穩定神鷹系列。
- 在許多新的特點進行自7.4.X補充說。
什麼在7.3.2版本新:
- 在發行說明:
- 從condor_status與-grid選項輸出的格式已更改為提供更多有用的信息。
- 在刪除附加到condor_status -format輸出的末尾換行符。因此,它解析這個命令的輸出代碼應該修剪的最後一行時,現在要小心。
- 在新功能:
- 在condor_fetchlog現在可以賣到condor_schedd守護進程的歷史文件。而且,保存的condor_schedd守護進程的歷史文件現在可以每天或每月旋轉。
- 在該condor_ckpt_server會自動清理過時檢查點文件。該控制此行為的配置變量描述如下。
- 在該condor_ckpt_server(無論是32位或64位)的可執行文件現在將正確地傳達之間的32位和64位提交節點。如果通過一定的偶然性位寬的問題發生在檢查點協議(例如,與文件大小),清晰的錯誤信息記錄在檢查點服務器日誌。
- 在新condor_ssh_to_job工具允許運行作業的交互式調試。請參閱[*]的細節。 手冊頁
- 的condor_status命令現在基本上更快,尤其是與-format選項。
- 在電網的宇宙網型GT5已添加提交新的Globus GRAM5服務。當一個GRAM服務被識別為GT5,jobmanager節流和網格監視器不被使用。參見5.3.2節的詳細信息。
- 在電網的宇宙網型霜添加了對提交gLite的CREAM就業服務。參見5.3.8節的詳細信息。
- 當低文件描述符創建新的網絡套接字,condor_schedd守護現在避免無限疊加起來的消息,它會定期發送給condor_negotiator和condor_startd。
- 在網格監控的性能和故障處理都得到了提高。
- 對於網格中的宇宙柵式nordugrid,現在使用Nordugrid ARC的LDAP服務器,這將大大提高性能,獲得作業狀態信息。此外,神鷹可以將這些作業運行時,現在說不清。
- 在新-valgrind選項condor_submit_dag原因condor_submit_dag代替condor_dagman二進制為可執行文件生成使用的valgrind上condor_dagman一個提交描述文件。
- 在condor_dagman現在懶洋洋地評估,並打開節點作業日誌文件。相反解析所有提交的說明文件,並立即在啟動時打開他們指定的日誌文件,condor_dagman現在解析每個作業提交之前提交描述文件,並有每個日誌文件打開,只有當相關作業隊列中或執行後腳本。此外,condor_dagman現在會自動生成一個不指定一個任意節點作業默認的用戶日誌文件。
- 無論是對MPI宇宙的支持和文檔已被刪除。 MPI的應用程序通過使用平行宇宙的支持。
- 當虛擬機軟件condor_startd守護進程的測試失敗(配置為可運行的虛擬機的機器),該condor_startd將定期重試試驗,直到成功為止。
- 的nordugrid_gahp現在限制到每個NorduGrid ARC服務器建立的連接的數量和重複使用的連接時可能的。
- 新增的ClassAd函數eval(),它接受一個字符串參數和評估字符串作為ClassAd表達的內容。一個政策的例子,這是非常有用的是在第3.5.9對工作暫停描述。
- 在新condor_q選項-attributes限制其使用-xml或-long選項時所顯示的屬性。限制的屬性的數量也增加了查詢的效率。
- 在禿鷹的電源管理功能,現在實現為一個插件。特別是,condor_startd現在運行一個外部程序,所指定的配置變量HIBERNATION_PLUGIN,以執行可用低功率狀態的檢測和切換到這些低功率狀態。
- 在新的神鷹守護condor_rooster已添加喚醒冬眠機時的配置中定義的變量表達式變得UNHIBERNATE真。有關condor_rooster配置變量在第3.3.35中描述。
- 添加到提取用戶事件日誌讀者態緩衝器到用戶日誌讀取器信息的能力。這是通過一個新的ReadUserLogStateAccess C ++類中定義read_user_log.h實施。
- 更改組態變量CERTIFICATE_MAPFILE的值或文件的內容到它是指不再需要神鷹的完全重新開始。相反,命令condor_reconfig將導致使用的更改。
- 在該condor_master守護程序現在將打印的路徑和參數啟動,如果D_FULLDEBUG啟用任何守護進程。此前,有沒有辦法得到它顯示的參數與它起一個守護進程。
- 在該condor_had守護現在有控制守護進程比其他condor_negotiator的能力。這是通過HAD_CONTROLLEE宏來控制。
- 在神鷹現在認識到X.509代理VOMS擴展。在VOMS屬性編碼作業ClassAd屬性X509UserProxySubject。
- 在該condor_startd現在可以清理滯留的虛擬機,下面神鷹或者其主機操作系統的崩潰。
- 在經過大跌,condor_gridmanager不再重新啟動所有jobmanagers的GT2職位。這應該改善恢復時間。
- 在神鷹作品歸類為通用在condor_collector守護進程的ClassAds更好。是自己註冊的通用ClassAds各種後台程序現在可以有它使用-subsystem選項正確地處理自己的ClassAds工具。
- 在神鷹現在提供了一個機制來執行嚴格的資源限制了運行作業的一些宇宙。
- 在配置變量添加和更改:
- 在新的配置變量EMAIL_SIGNATURE指定自定義簽名被附加到電子郵件的神鷹系統發送。如果定義,那麼這個定制的簽名取代內部指定的默認之一。有此變量沒有默認值。
- 在新的配置變量CKPT_SERVER_CLIENT_TIMEOUT通知condor_schedd多久,它是在幾秒鐘內願意等待,試圖跟一個condor_ckpt_server過程聲明condor_ckpt_server下來之前。見3.3.11的完整描述。
- 在新的配置變量CKPT_SERVER_CLIENT_TIMEOUT_RETRY通知,一旦condor_ckpt_server被標記為已下condor_schedd,怎麼可能會秒必須通過前condor_schedd會嘗試與condor_ckpt_server再次溝通。見3.3.11的完整描述。
- 在新的配置變量CKPT_SERVER_REMOVE_STALE_CKPT_INTERVAL通知開始清除陳舊的檢查站,在以秒為單位指定的時間間隔的condor_ckpt_server。參見3.3.8節的完整描述。
- 在新的配置變量CKPT_SERVER_STALE_CKPT_AGE_CUTOFF通知condor_ckpt_server檢查點文件的訪問時間必須多大是為了被視為失效。這一次是比較反對的,現在當檢查點服務器檢查檢查點映像文件的當前觀點。參見3.3.8節的完整描述。
- 在新的配置變量SlotWeight可以用來計算時使用,計算公平共享,並強制執行組配額給插槽更大的權重。為完整的描述,請參閱3.3.10。
- 在新的配置變量MAX_PERIODIC_EXPR_INTERVAL實現週期性表現,評價之間的時間上限,由於自適應時序配置變量PERIODIC_EXPR_TIMESLICE暗示。為完整的描述,請參閱3.3.11。
- 新的配置變量GRIDMANAGER_SELECTION_EXPR可以用來控制多少condor_gridmanager進程將被衍生以管理網格宇宙作業。由於這種變化的一部分,去掉了配置變量,支持代碼GRIDMANAGER_PER_JOB由於新配置變量取代它。為完整的描述,請參閱3.3.11。
- 在配置變量GRIDMANAGER_MAX_PENDING_SUBMITS_PER_RESOURCE和相應的油門GRIDMANAGER_MAX_PENDING_SUBMITS已被刪除。
- 在新的配置變量GRID_MONITOR_DISABLE_TIME控制多久試圖重新啟動電網監控作業之前遇到錯誤後condor_gridmanager等待。為完整的描述,請參閱3.3.23。
- 在新的預定義的配置宏DETECTED_MEMORY表示物理內存(RAM)由神鷹檢測量。該值以MB為單位。
- 在新的預定義的配置宏DETECTED_CORES指示由神鷹檢測CPU內核的數量。
- 在新的配置變量DELEGATE_FULL_JOB_GSI_CREDENTIALS控制一個完整的或有限的X.509代理是否被委託電網類型GT2電網宇宙的工作。為完整的描述,請參閱3.3.26。
- 在新的配置變量UNHIBERNATE所使用的condor_startd在ClassAd做廣告一個布爾表達式,指定當機器應該被喚醒,例如通過condor_rooster。為完整的描述,請參閱3.3.10。
- 新的配置變量HIBERNATION_PLUGIN指定的路徑插件,其中condor_startd同時使用,以檢測一台機器的低功率狀態的能力,並到機器切換到低功率狀態。為完整的描述,請參閱3.3.10。
- 在新的配置變量HIBERNATION_PLUGIN_ARGS指定額外的命令行參數其中condor_startd將傳遞給插件調用它的機切換到低功耗狀態時。為完整的描述,請參閱3.3.10。
- 新的配置變量HIBERNATION_OVERRIDE_WOL可以用來指示condor_startd忽略喚醒設備的網絡接口的LAN(WOL)功能,並且可切換到低功率狀態,即使接口不支持WOL,或者如果WOL禁用就可以了。為完整的描述,請參閱3.3.10。
- 在新的配置變量DAGMAN_USER_LOG_SCAN_INTERVAL控制長condor_dagman檢查作業日誌文件的狀態更新之間如何等待。為完整的描述,請參閱3.3.25。
- 在新的配置變量DAGMAN_DEFAULT_NODE_LOG設置新condor_dagman默認節點日誌文件的功能默認的日誌文件名。為完整的描述,請參閱3.3.25。
- 刪除配置變量DAGMAN_DELETE_OLD_LOGS;新的日誌文件讀取代碼,使得它已經過時了。
- 在新的配置變量HAD_CONTROLLEE用於指定該condor_had控制守護進程的名稱。此名稱應在condor_master的DAEMON_LIST匹配守護程序的名稱。
- 在修復的錯誤:
- 修正了ClassAd功能的臭蟲論據應該已經正確地強制轉換為字符串,而不是計算誤差。
- 修正了JobRouter,5分鐘被提交內被刪除的作業時,即發生混亂的診斷信息。
- 修正了在使用動態插槽(見第3.13.7)所引起的機器ClassAd屬性SLOT_STARTD_ATTRS從ClassAd消失一段插槽。
- 修正了其中屬於Condor任務窗口不接收繪製消息在Windows平台上的錯誤。
- 修正了一個導致condor_q - 分析當時沒有condor_schedd守護ClassAd文件崩潰的bug。
- 修正了condor_procd崩潰引起的,當監視進程的環境超過1Mb的在/ proc。
- 修正了Windows平台上的錯誤,可能導致condor_credd崩潰,如果請求的證書不在密碼存儲區。
- 修正了任務事件日誌旋轉鎖定為與不正確的權限創建一個bug。
- 在固定作業事件日誌的旋轉中的錯誤可能導致它從未在禿鷹的Windows移植旋轉。
- 在固定作業的事件日誌初始化一個潛在的競爭狀態。
- 修正競爭狀態,可能導致在關機condor_collector和condor_schedd崩潰。
- 修正了其中condor_master有時會死,並產生時,無論是由於重新啟動新的二進制文件的時間戳或當最初開始dprintf_failure.MASTER文件中的錯誤。
- 在固定相關,當禿鷹重新配置發生SOAP配置變量內存洩漏。
- 修正了其提交描述文件命令cron_day_of_week被錯誤地忽略了一個錯誤。
- 修正了其中的配置變量MAX_JOB_QUEUE_LOG_ROTATIONS和GRIDMANAGER_SELECTION_EXPR不會在啟動時正常工作的bug;他們只有一個condor_reconfig後的工作。
- 修正了其SOAP行動是被錯誤地授權與對端IP中的錯誤。
- 在修正中,並非所有神鷹守護是由Windows防火牆(以前稱為Internet連接防火牆或ICF)信任的Windows平台上的錯誤。
- 修正了關機競爭條件在condor_master相對於高可用性守護進程。
- 修正了一個錯誤,其中神鷹守護程序錯誤決定,它已用完的套接字描述符。
- 修正了一個錯誤的condor_schedd會阻止的時間很長的時間,同時試圖連接到一個檢查點下來的服務器。現在condor_schedd會做一個阻塞以超時連接到檢查站服務器為幾秒鐘的配置數量。如果連接失敗,condor_schedd將把暫停連接到檢查點服務器,直到配置暫停期間通行證。描述此行為的配置文件變量如上所述。
- 在改變了的支票,condor_dagman確實為運行相同的DAG其他condor_dagman情況下,如果發現在啟動時鎖定文件。現在,如果condor_dagman不能確定對方是否DAGMan是活的,再這樣下去,而不是退出。
- 修正了鸛守護進程的一個主要文件描述符洩漏。
- 修正了其成功的鸛轉移被標記為失敗。錯誤
- 在固定閱讀格式錯誤事件時,在用戶事件日誌文件讀取代碼,一種罕見的內存洩漏。
- 修正了在多機ClassAds與同名condor_collector,但不同的StartdIPAddr屬性值,將導致condor_negotiator退出並提供一個錯誤。這是不尋常的,不應該發生在一個典型的神鷹安裝。最可能的原因是使用condor_advertise為電網牽線搭橋做廣告定制ClassAds。
- 修正了condor_dagman核心轉儲如果所有提交的嘗試失敗有一個POST腳本DAG節點上的錯誤。因為禿鷹版本7.1.4這個bug已經存在。
- 修正了condor_schedd,當配置變量NEGOTIATOR_MATCH_EXPRS使用發生內存洩漏。
- 修正了這把腳本作為可執行文件在Windows平台代碼中的錯誤。未知的文件擴展名被視為錯誤,而不是作為Windows可執行文件。
- 的condor_job_router現在正確地設置創建一個新的路由作業時ClassAd屬性EnteredCurrentStatus到當前時間。此前,它複製從原來的工作這個屬性。
- 在該condor_job_router發出一個更友好的日誌信息時,它指出,在拆卸作業的路由副本。
- 系統修復已為出現在7.3.1一個問題,即使用建行神鷹守護程序連接到其他神鷹守護進程有時會消耗沒有很好的理由大量的CPU時間。
- 修正了它試圖通過建行連接可以留在待定狀態無限期一個罕見的失敗案例的bug。
- 系統僅針對Unix錯誤導致禿鷹守護進程無法啟動,如果MAX_FILE_DESCRIPTORS進行配置比繼承神鷹當前硬限制高。如果神鷹以root權限運行,這已不再是這種情況。
- 在該condor_gridmanager現在做廣告電網ClassAds適當的時候有多個condor_collector守護進程。
- 當使用condor_q -xml和-format在一起,以限制ClassAd的數目在查詢屬性返回,並沒有生成的XML容器標籤。這是固定的,但現在的首選方式來限制返回的屬性是使用condor_q選項-attributes。
- 修正了一個在其中當試圖重新啟動本身,如果被定義配置變量MASTER_LOCK,或者如果condor_master與-t選項調用了Unix condor_master失敗的bug。自7.0系列的這個bug已經存在,而且很可能已經存在比這更長的時間。
- 修正了gahp_server一個顯著內存洩漏。此洩漏只出現在以前的神鷹7.3.x版本。
- 修正了可能會導致持有,然後釋放返回空閒狀態的去除工作中的錯誤。
- 在散發著X86-64 RHEL 5的RPM被損壞,造成GT4網格式作業失敗的Globus的jar文件。這已得到修復。
什麼在7.2.2版本新:
- 在增加神鷹的全端口的Debian 5.0 x86平台。
- 新增神鷹的修剪口的Debian 5.0 x86_64的平台。
- 新增的-DumpRescue命令行標誌,以condor_dagman和condor_submit_dag。此標誌的目的主要是用於測試。
- 在增加了對-debug選項condor_qedit支持。
- 作業路由器現在使用一個時間片定時器定期表達式計算,類似condor_schedd守護程序。評估間隔由配置變量PERIODIC_EXPR_INTERVAL控制,默認為60秒,使用的condor_schedd守護進程相同的默認值。
- 在作業路由器現在復位源工作,如果更新condor_schedd守護定期表達式計算為True時出現故障。作業的週期性表現,應過一段時間有一個成功的更新評估的未來。
什麼在7.2.0版本新:
- 在主要功能增強
什麼是7.0.5版本,新的:
- 在本新聞稿中包含了許多錯誤修正和改進了一些錯誤處理本地宇宙的作業。
- 請注意,一些錯誤修正是與安全有關的;因此,網站應該升級或限制在允許禿鷹作業提交到用戶信賴誰的權限。
評論沒有發現