الفلك

مصادر مجموعة البيانات المتعلقة بعلم الفلك؟

مصادر مجموعة البيانات المتعلقة بعلم الفلك؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أقوم بمشروع لفصل الإحصاء ، واعتقدت أنه قد يكون عملًا مثيرًا للاهتمام مع مجموعة بيانات مرتبطة بعلم الفلك. لا أعرف شيئًا على الإطلاق عن علم الفلك ، لسوء الحظ ، ولن أعرف حتى أين أبحث عن أي مجموعات كبيرة من البيانات. على نحو مفضل ، أريد بعض البيانات التي يمكن أن تتوافق مع نموذج الانحدار ، أي المتغيرات التوضيحية بالإضافة إلى متغير الاستجابة. هل يعرف أحد مكانًا للبحث عن ما أصفه؟

أعلم أن السؤال عام نوعًا ما - أعتقد أن الجزء المهم هو أن البيانات "مثيرة للاهتمام" إلى حد ما (شيء يفهمه الشخص العادي) ، وأن هناك متغيرات متعددة قد يكون لها ارتباط.


لديك الكثير من الخيارات!

أنا متخصص في علم الفلك بالأشعة السينية ، ثم يمكنني أن أقترح عليك العديد من المرافق: عادةً ما يقدمون بعض بياناتهم على الأقل متاحة للجمهور. نصيحة ، لديك بيانات لمنحنيات الضوء (معدلات عدد الفوتونات مقابل الوقت) ، و / أو الأطياف (أي التدفق مقابل الطاقة).

أقترح عليك العمل على منحنيات الضوء: فهي متاحة بسهولة ، وقد تم تقليلها بالفعل (لا يتعين عليك اللعب بالبيانات لجعلها قابلة للاستخدام ، يمكنك استخدامها مباشرة) ، وهي تلائم طلبك للتوافق مع الانحدار نموذج. تتمتع الأطياف أيضًا بالاستمتاع ، وما زلت أعرف بعض المنظرين الذين ليسوا على دراية بالأطياف ، بالإضافة إلى أنهم يحتاجون عادةً إلى مزيد من المعرفة ، بسبب ملفات الاستجابة ، وحزم التجهيز الطيفي ، إلخ.

فيما يلي قائمة ببعض المرافق مع البيانات المتاحة:

روسي إكس-راي إكسبلورر

سويفت / بات

متكامل

شاندرا

ماكسي

هنا أيضًا يمكنك العثور على قائمة بالعديد من المرافق بمشاركة ناسا ، وبالتالي فإن القائمة أكبر بكثير.

بالطبع يمكنك أيضًا استخدام نوع آخر من البيانات (ضوئي ، الأشعة تحت الحمراء ، الراديو) من خلال مشروع MAST ، لكن ليس لدي خبرة في ذلك. أعتقد ، في النطاق البصري ، أن تلسكوب هابل الفضائي سيحتوي على كمية هائلة من البيانات!

إذا كنت بحاجة إلى يد ، بعد التصويت لصالح SE / التصويت لصالح الموضة العصابية ، أخبرني بذلك. حظا سعيدا!


التوقعات الوظيفية لـ: علماء الفيزياء وعلماء الفلك

من المتوقع أن ينمو التوظيف العام للفيزيائيين وعلماء الفلك بنسبة 14 في المائة من عام 2016 إلى عام 2026 ، وهو أسرع من المتوسط ​​لجميع المهن.

من المتوقع أن يحصل الفيزيائيون على نمو في التوظيف في خدمات البحث العلمي والتطوير ، والخدمات التعليمية ، والرعاية الصحية والمساعدة الاجتماعية. سيؤدي النمو السريع إلى توفير حوالي 2600 وظيفة جديدة فقط خلال فترة السنوات العشر.

يعتبر علماء الفلك مهنة صغيرة ، وسيؤدي النمو السريع إلى توفير حوالي 200 وظيفة جديدة فقط خلال فترة العشر سنوات.

الإنفاق الفيدرالي هو المصدر الرئيسي لأموال البحوث المتعلقة بالفيزياء وعلم الفلك ، خاصة بالنسبة للبحوث الأساسية. من المتوقع أن يكون النمو في إنفاق الحكومة الفيدرالية على الأبحاث في الفيزياء وعلم الفلك ثابتًا إلى حد ما ، وهذا سيقلل من الحاجة إلى علماء الفيزياء وعلماء الفلك في المؤسسات التي تعتمد بشكل كبير على مثل هذا التمويل.

فرص عمل

من المتوقع أن تكون المنافسة على التعيينات البحثية الدائمة ، مثل تلك الموجودة في الكليات والجامعات ، قوية. على نحو متزايد ، الحاصلين على درجة الدكتوراه. قد تحتاج إلى العمل من خلال مواعيد متعددة لما بعد الدكتوراه قبل العثور على وظيفة دائمة. بالإضافة إلى ذلك ، فإن عدد المقترحات البحثية المقدمة للتمويل ينمو بوتيرة أسرع من حجم الأموال المتاحة ، مما تسبب في مزيد من المنافسة على المنح البحثية.

على الرغم من المنافسة على وظائف البحث التقليدية ، يجب أن تكون الآفاق جيدة للفيزيائيين في البحث التطبيقي والتطوير والمجالات التقنية ذات الصلة سيجد الخريجون الحاصلون على أي درجة أكاديمية في الفيزياء أو علم الفلك ، من درجة البكالوريوس إلى الدكتوراه ، معرفتهم بالعلوم والرياضيات مفيدة للالتحاق بالعديد من المهن الأخرى. مهارات إدارة قواعد البيانات مفيدة أيضًا ، بسبب مجموعات البيانات الكبيرة التي يعمل معها هؤلاء المحترفون.

يعتمد جزء كبير من أبحاث الفيزياء وعلم الفلك على الأموال الفيدرالية ، لذا فإن الميزانيات الفيدرالية لها تأثير كبير على فرص العمل من سنة إلى أخرى.


يجب اختبار جميع الكود المقدم باستخدام إطار اختبار الأنف. للحصول على أمثلة حول كيفية عمل هذه الاختبارات ، راجع الاختبارات داخل حزمة astroML وكل من وحداتها الفرعية.

يجب توثيق جميع التعليمات البرمجية المقدمة باتباع دليل وثائق Numpy. هذا أسلوب توثيق موحد تستخدمه العديد من الحزم في عالم scipy.

بالإضافة إلى ذلك ، يوصى بشدة بإنشاء نماذج نصية توضح فائدة الطريقة على مجموعة بيانات فلكية (يفضل استخدام مجموعات البيانات المتاحة من خلال مجموعات البيانات astroML). يمكن رؤية بعض هذه البرامج النصية النموذجية في أمثلة الدليل الفرعي لمستودع المصدر الرئيسي: example_root.

هذه الوثائق متعلقة بالإصدار 0.4 من astroML
ونسخ 2012-2019 ، Jake Vanderplas & amp AstroML Developers. تم إنشاؤه باستخدام Sphinx 2.1.2. تصميم Web y Limonada. إظهار مصدر هذه الصفحة


استخدام البيانات

مرحبًا بك في كتالوج البيانات Science On a Sphere & # 174!

تم إنشاء معظم مجموعات البيانات الموجودة في كتالوج Science On a Sphere & # 174 بواسطة NOAA و NASA وهي متاحة مجانًا للاستخدام العام. تم إنشاء البعض الآخر من قبل متاحف العلوم والجامعات وأفراد آخرين.

يتم سرد معلومات المصدر والائتمان لكل مجموعة بيانات في العمود الموجود على الجانب الأيمن من الصفحات الفردية لمجموعات البيانات. تأكد من التحقق من المصدر قبل استخدام مجموعة البيانات. لمزيد من المعلومات ، يرجى زيارة إشعار حقوق النشر الخاص بنا. إذا كانت لديك أسئلة ، فلا تتردد في الاتصال بيث راسل.


مصادر مجموعة البيانات المتعلقة بعلم الفلك؟ - الفلك

AstroML: كود التعلم الآلي لعلم الفلك

AstroML هي وحدة Python للتعلم الآلي واستخراج البيانات مبنية على numpy و scipy و scikit-Learn و matplotlib ، ويتم توزيعها بموجب ترخيص BSD 3-Clause. يحتوي على مكتبة متنامية من إجراءات التعلم الإحصائي والآلي لتحليل البيانات الفلكية في لغة الثعبان ، ومحمل للعديد من مجموعات البيانات الفلكية المفتوحة ، ومجموعة كبيرة من الأمثلة لتحليل وتصور مجموعات البيانات الفلكية.

بدأ هذا المشروع في عام 2012 بواسطة Jake VanderPlas لمرافقة الكتاب الإحصاء واستخراج البيانات والتعلم الآلي في علم الفلك بقلم زيليكو إيفيزيك وأندرو كونولي وجاكوب فاندربلاس وأليكس جراي.

ينقسم المشروع إلى جزئين. مكتبة astroML الأساسية مكتوبة بلغة python فقط ، وهي مصممة لتكون سهلة التثبيت جدًا لأي مستخدم ، حتى أولئك الذين ليس لديهم مترجم C أو فورتران. يمكن تثبيت مكتبة مصاحبة ، astroML_addons ، اختياريًا لزيادة الأداء على خوارزميات معينة. كل خوارزمية في astroML_addons لها نظير بيثون خالص في تطبيق astroML الأساسي ، لكن مكتبة astroML_addons تحتوي على تطبيقات أسرع وأكثر كفاءة في التعليمات البرمجية المجمعة. علاوة على ذلك ، إذا تم تثبيت astroML_addons على نظامك ، فستقوم مكتبة astroML الأساسية باستيراد واستخدام الإجراءات الأسرع افتراضيًا.

سبب هذا الانقسام هو سهولة الاستخدام للقادمين الجدد إلى بايثون. إذا كانت المتطلبات الأساسية مثبتة بالفعل على نظامك ، فيمكن تثبيت مكتبة astroML الأساسية واستخدامها على أي نظام دون مشاكل تذكر. تتطلب مكتبة astroML_addons مترجم لغة سي ، ولكنها مصممة أيضًا لتكون سهلة التثبيت للمستخدمين الأكثر تقدمًا. انظر المزيد من المناقشة في "التنمية" أدناه.

  • وثائق HTML: http://astroML.github.com
  • مستودع رمز المصدر: http://github.com/astroML/astroML
  • أداة تعقب المشكلات: http://github.com/astroML/astroML/issues
  • القائمة البريدية: https://groups.google.com/forum/#!forum/astroml-general

تستخدم هذه الحزمة التوزيعات ، وهي الطريقة الافتراضية لتثبيت وحدات بايثون. قبل التثبيت ، تأكد من أن نظامك يفي بالمتطلبات الأساسية المدرجة في التبعيات أدناه.

لتثبيت حزمة astroML الأساسية في دليلك الرئيسي ، استخدم:

يمكنك تحديد دليل عشوائي للتثبيت باستخدام:

لتثبيت على مستوى النظام على أنظمة Linux / Unix:

تتطلب حزمة astroML_addons مترجم C / C ++ صالحًا للتثبيت. يمكن تثبيته باستخدام:

يمكن للبرنامج النصي الاستفادة من أي من الخيارات الإضافية التي تمت مناقشتها أعلاه.

هناك ثلاثة مستويات من التبعيات في astroML. النواة التبعيات مطلوبة لحزمة astroML الأساسية. اضافه التبعيات مطلوبة لأداء astroML_addons. اختياري التبعيات مطلوبة لتشغيل بعض (وليس كل) أمثلة البرامج النصية. ستدرج أمثلة البرامج النصية الفردية تبعياتها الاختيارية في أعلى الملف.

تتطلب حزمة astroML الأساسية ما يلي:

    الإصدار 2.6.x - 2.7.x (لا يدعم AstroML بايثون 3.x) & gt = 1.4 & gt = 0.7 & gt = 0.99 & gt = 3.0. PyFITS هو قارئ بيثون لملفات نظام نقل الصور المرن (FITS) ، بناءً على cfitsio. تتطلب العديد من أدوات تحميل مجموعة البيانات حزمًا.

يتطابق هذا التكوين مع إصدار Ubuntu 10.04 LTS من أبريل 2010.

لإجراء اختبارات الوحدة ، ستحتاج أيضًا إلى أنف و GT = 0.10

يتطلب الكود السريع في astroML_addons مترجم C / C ++ عاملاً.

تتطلب العديد من أمثلة البرامج النصية حزمًا متخصصة أو مطورة. يتم سرد هذه المتطلبات في الجزء العلوي من البرامج النصية المعينة

    أضاف الإصدار 0.11 وحدة فرعية للرسم البياني المتناثر. يتطلب المثال الأدنى للشجرة الممتدة scipy & gt = 0.11 يوفر واجهة لطيفة لـ Markov-Chain Monte Carlo. تستخدم العديد من الأمثلة pyMC لاستكشاف المساحات عالية الأبعاد. تمت كتابة الأمثلة باستخدام الإصدار 2.2 من pymc والذي يوفر واجهة لنظام HEALPix البيكسل ، بالإضافة إلى التحويلات التوافقية الكروية السريعة.

تم تصميم هذه الحزمة لتكون مستودعًا لرمز علم الفلك المكتوب جيدًا ، ويتم تشجيع تقديم إجراءات جديدة. بعد تثبيت بوابة نظام التحكم في الإصدارات ، يمكنك التحقق من أحدث المصادر من جيثب باستخدام:

أو إذا كان لديك امتيازات الكتابة:

نحن نشجع بشدة مساهمات الشفرة المفيدة المتعلقة بعلم الفلك: لكي تكون astroML أداة ذات صلة لمجتمع Python / علم الفلك ، ستحتاج إلى النمو مع مجال البحث. هناك بعض الإرشادات للمساهمة:

يجب أن تتم أي مساهمة من خلال نظام طلب السحب github (لمزيد من المعلومات ، راجع صفحة التعليمات يجب أن يتوافق الرمز المقدم إلى astroML مع ترخيص نمط BSD ، واتبع دليل أسلوب PEP8.

التوثيق والأمثلة

يجب توثيق جميع التعليمات البرمجية المقدمة باتباع دليل وثائق Numpy. هذا أسلوب توثيق موحد تستخدمه العديد من الحزم في عالم scipy.

بالإضافة إلى ذلك ، يوصى بشدة بإنشاء نماذج نصية توضح فائدة الطريقة على مجموعة بيانات فلكية (يفضل استخدام أدوات التحميل في مجموعات البيانات astroML). توجد أمثلة البرامج النصية هذه في أمثلة الدليل الفرعي لمستودع المصدر الرئيسي.

لقد اتخذنا القرار في وقت مبكر لفصل الإجراءات الأساسية عن الإجراءات المجمعة عالية الأداء. هذا للتأكد من أن تثبيت الحزمة الأساسية بسيط قدر الإمكان (أي لا يتطلب مترجم C).

يتم تشجيع مساهمات الكود المترجم الفعال في astroML_addons: يعد توفر التطبيقات الفعالة للخوارزميات الشائعة في Python أحد أقوى ميزات عالم Python. الطريقة المفضلة لتغليف المكتبات المترجمة هي استخدام خيارات cython الأخرى (النسج ، SWIG ، إلخ) التي يصعب بناؤها وصيانتها.

في الوقت الحالي ، تنص السياسة على أن أي خوارزمية فعالة مضمنة في astroML_addons يجب أن يكون لها تطبيق مكرر للغة python فقط في astroML ، مع رمز يحدد الروتين الأسرع إذا كان متاحًا. (للحصول على مثال عن كيفية عمل ذلك ، راجع تعريف دالة lomb_scargle في astroML / periodogram.py). توجد هذه السياسة لسببين:

  1. يسمح للمستخدمين المبتدئين بالحصول على جميع وظائف astroML دون الحاجة إلى صداع خطوات التثبيت المعقدة.
  2. إنها تخدم غرضًا تعليميًا: غالبًا ما تكون تطبيقات Python فقط أسهل في القراءة والفهم من التطبيقات المكافئة في C أو cython.
  3. يفرض ممارسة الترميز الجيدة لتجنب التحسين المبكر. تأكد أولاً من عمل الكود (أي اكتبه بلغة بيثون بسيطة). ثم قم بإنشاء نسخة محسنة في الوظائف الإضافية.

إذا ثبت أن هذه السياسة مرهقة بشكل خاص في المستقبل ، فقد تتم إعادة النظر فيها.


مصادر مجموعة البيانات المتعلقة بعلم الفلك؟ - الفلك

AstroML: التعلم الآلي لعلم الفلك

AstroML هي وحدة Python للتعلم الآلي واستخراج البيانات مبنية على numpy و scipy و scikit-Learn و matplotlib ، ويتم توزيعها بموجب ترخيص BSD. يحتوي على مكتبة متنامية من الإجراءات الإحصائية والتعلم الآلي لتحليل البيانات الفلكية في لغة الثعبان ، ومحمل للعديد من مجموعات البيانات الفلكية المفتوحة ، ومجموعة كبيرة من الأمثلة لتحليل وتصور مجموعات البيانات الفلكية.

بدأ هذا المشروع في عام 2012 بواسطة Jake VanderPlas لمرافقة الكتاب الإحصاء واستخراج البيانات والتعلم الآلي في علم الفلك بقلم زيليكو إيفيزيك وأندرو كونولي وجاكوب فاندربلاس وأليكس جراي.

  • وثائق HTML: http://www.astroML.org
  • مستودع كود المصدر الأساسي: http://github.com/astroML/astroML
  • أداة تعقب المشكلات: http://github.com/astroML/astroML/issues
  • القائمة البريدية: https://groups.google.com/forum/#!forum/astroml-general

تستخدم هذه الحزمة التوزيعات ، وهي الطريقة الافتراضية لتثبيت وحدات بايثون. قبل التثبيت ، تأكد من أن نظامك يلبي المتطلبات الأساسية المدرجة في التبعيات ، المدرجة أدناه.

لتثبيت حزمة astroML الأساسية في دليلك الرئيسي ، استخدم:

الحزمة الأساسية عبارة عن Python نقية ، لذا يجب أن يكون التثبيت مباشرًا على معظم الأنظمة. للتثبيت من المصدر ، استخدم:

يمكنك تحديد دليل عشوائي للتثبيت باستخدام:

لتثبيت على مستوى النظام على أنظمة Linux / Unix:

هناك مستويان من التبعيات في astroML. النواة التبعيات مطلوبة لحزمة astroML الأساسية. اختياري التبعيات مطلوبة لتشغيل بعض (وليس كل) أمثلة البرامج النصية. ستدرج أمثلة البرامج النصية الفردية تبعياتها الاختيارية في أعلى الملف.

تتطلب حزمة astroML الأساسية ما يلي:

    الإصدار 2.7 و 3.3+ & gt = 1.4 & gt = 0.11 & gt = 0.18 & gt = 0.99 & gt = 1.1 مطلوب AstroPy لقراءة ملفات نظام نقل الصور المرن (FITS) ، والتي تستخدمها العديد من مجموعات البيانات.

يتطابق هذا التكوين مع إصدار Ubuntu 10.04 LTS من أبريل 2010 ، مع إضافة scikit-Learn.

لإجراء اختبارات الوحدة ، ستحتاج أيضًا إلى أنف و GT = 0.10

تتطلب العديد من أمثلة البرامج النصية حزمًا متخصصة أو مطورة. يتم سرد هذه المتطلبات في الجزء العلوي من البرامج النصية المعينة

    يوفر واجهة لطيفة لماركوف تشاين مونت كارلو. تستخدم العديد من أمثلة astroML نظام pyMC لاستكشاف المساحات عالية الأبعاد. تمت كتابة الأمثلة باستخدام الإصدار 2.2 من pymc والذي يوفر واجهة لنظام HEALPix البيكسل ، بالإضافة إلى التحويلات التوافقية الكروية السريعة.

تم تصميم هذه الحزمة لتكون مستودعًا لرمز علم الفلك المكتوب جيدًا ، ويتم تشجيع تقديم إجراءات جديدة. بعد تثبيت نظام التحكم في الإصدارات Git ، يمكنك التحقق من أحدث المصادر من GitHub باستخدام:

أو إذا كان لديك امتيازات الكتابة:

نحن نشجع بشدة مساهمات الشفرة المفيدة المتعلقة بعلم الفلك: لكي تكون astroML أداة ذات صلة لمجتمع Python / علم الفلك ، ستحتاج إلى النمو مع مجال البحث. هناك بعض الإرشادات للمساهمة:

يجب أن تتم أي مساهمة من خلال نظام طلب السحب github (لمزيد من المعلومات ، راجع صفحة التعليمات يجب أن يتوافق الرمز المقدم إلى astroML مع ترخيص نمط BSD ، واتبع دليل أسلوب PEP8.

التوثيق والأمثلة

يجب توثيق جميع التعليمات البرمجية المقدمة باتباع دليل وثائق Numpy. هذا أسلوب توثيق موحد تستخدمه العديد من الحزم في عالم scipy.


مصادر مجموعة البيانات المتعلقة بعلم الفلك؟ - الفلك

تحتوي مجموعات البيانات الثنائية على قيمتين (قابلتين للاستخدام) فقط: 0 (تُعرف أيضًا باسم الخلفية) أو 1 (تُعرف أيضًا باسم المقدمة). يتم إنشاؤها بعد تطبيق بعض التصنيفات الثنائية على مجموعة البيانات. الأكثر شيوعًا هو العتبة: على سبيل المثال ، في صورة ما ، يتم إعطاء وحدات البكسل ذات القيمة الأعلى من العتبة قيمة 1 وتلك ذات القيمة الأقل من العتبة يتم تعيين قيمة لها 0.

نظرًا لوجود قيمتين فقط ، في معالجة الصور الثنائية ، فأنت مهتم عادةً بتحديد موضع العنصر وجواره (جيرانه). عندما تحتوي مجموعة البيانات على أكثر من بُعد واحد ، يمكن تحديد فئات متعددة من الجوار المباشرين (التي تلامس العنصر) لكل عنصر من عناصر البيانات. لفصل هذه الفئات المختلفة من الجيران المباشرين ، نحدد الاتصال.

يتم التصنيف من خلال المسافة من مركز العنصر إلى مركز الجار & rsquos. أقرب الجيران المباشرين لديهم اتصال 1 ، وثاني أقرب فئة من الجيران لديهم اتصال 2 وما إلى ذلك. في المجموع ، أكبر اتصال ممكن للبيانات ذات الأبعاد ndim هو ndim. على سبيل المثال ، في مجموعة بيانات ثنائية الأبعاد ، تمتلك الجيران المتصلون بأربعة أجزاء (التي تشترك في حافة ولديها مسافة بكسل واحد) اتصالاً قدره 1. والأربعة المجاورة التي تشترك في قمة فقط (بمسافة ( sqrt <2) > ) بكسل) لديها اتصال 2. بشكل تقليدي ، تشتمل فئة الاتصال 2 المجاورة أيضًا على اتصال 1 جيران ، لذلك على سبيل المثال نسميهم 8 جيران متصلين في مجموعات بيانات ثنائية الأبعاد.

من الناحية المثالية ، يكفي بت واحد لكل عنصر من عناصر مجموعة البيانات الثنائية. ومع ذلك ، فإن وحدات المعالجة المركزية ليست مصممة للعمل على وحدات البت الفردية ، وأصغر وحدة من عناوين الذاكرة هي بايت (يحتوي على 8 بت على وحدات المعالجة المركزية الحديثة). لذلك ، في Gnuastro ، النوع المستخدم لمجموعة البيانات الثنائية هو uint8_t (انظر أنواع البيانات الرقمية). على الرغم من أنه يتطلب ذاكرة أكبر بمقدار 8 أضعاف ، إلا أن هذا الخيار يوفر أداءً أفضل بكثير وبعض الميزات الإضافية (المفيدة).

تتمثل ميزة استخدام بايت كامل لكل عنصر من عناصر مجموعة البيانات الثنائية في أنه يمكنك أيضًا الحصول على قيم أخرى (سيتم تجاهلها في المعالجة). إحدى هذه القيم الشائعة & ldquoother & rdquo في مجموعات البيانات الحقيقية هي قيمة فارغة (لتمييز المناطق التي لا يجب معالجتها نظرًا لعدم وجود بيانات). يجب استخدام قيمة GAL_BLANK_UINT8 الثابتة في هذه الحالات (انظر القيم الفارغة للمكتبة (فارغ. h)). آخر هو بعض القيم المؤقتة التي يمكن إعطاؤها إلى بكسل معالج لتجنب وجود نسخة أخرى من مجموعة البيانات كما في GAL_BINARY_TMP_VALUE الموضحة أدناه.

دقيق: GAL_BINARY_TMP_VALUE

تعمل الوظائف الموضحة أدناه على مجموعة بيانات من النوع uint8_t بقيم 1 أو 0 (لن يتم لمس أي بكسل آخر). ومع ذلك ، في بعض الحالات ، من الضروري وضع قيم مؤقتة في كل عنصر أثناء معالجة الوظائف. هذه القيمة المؤقتة لها معنى خاص للعملية وسيتم تشغيلها. لذلك إذا كانت مجموعات بيانات الإدخال الخاصة بك تحتوي على قيم غير 0 و 1 لا تريد أن تعمل هذه الوظائف عليها ، فتأكد من أنها لا تساوي قيمة الماكرو و rsquos. لاحظ أن هذه القيمة تختلف أيضًا عن GAL_BLANK_UINT8 ، لذلك قد تحتوي مجموعات بيانات الإدخال أيضًا على عناصر فارغة.

دور:
gal_data_t *
gal_binary_erode (gal_data_t * input، size_t num، int connectivity، int inplace)

قم بعمل عدد من التآكل على جيران الإدخال المتصلين (انظر أعلاه للتعرف على الاتصال).

إذا كان inplace غير صفري و نوع الإدخال & rsquos هو GAL_TYPE_UINT8 ، ثم سيتم التآكل داخل مجموعة بيانات الإدخال وسيتم إدخال المؤشر المرتجع. خلاف ذلك ، يتم نسخ الإدخال (وتحويله إذا لزم الأمر) إلى GAL_TYPE_UINT8 وسيتم التآكل في مجموعة البيانات الجديدة هذه والتي سيتم إرجاعها أيضًا. ستعمل هذه الوظيفة فقط على العناصر ذات القيمة 1 أو 0. وستترك جميع العناصر المتبقية بدون تغيير.

التآكل (معكوس التوسيع) هو عملية في التشكل الرياضي حيث يتم قلب كل بكسل أمامي يلامس بكسل الخلفية (يتم تغييره إلى الخلفية). تحدد قيمة الاتصال تعريف & ldquotouching & rdquo. سيؤدي التآكل بالتالي إلى تقليل مساحة مناطق المقدمة بطبقة واحدة من البكسل.

دور:
gal_data_t *
gal_binary_dilate (gal_data_t * input، size_t num، int connectivity، int inplace)

قم بعمل توسعات على جيران الإدخال المتصلين (انظر أعلاه للتعرف على الاتصال). لمزيد من المعلومات حول inplace والإخراج ، راجع gal_binary_erode.

التوسيع (معكوس التآكل) هو عملية في التشكل الرياضي حيث يتم قلب كل بكسل خلفية يلامس بكسل في المقدمة (يتم تغييره إلى المقدمة). تحدد قيمة الاتصال تعريف & ldquotouching & rdquo. سيؤدي التمدد بالتالي إلى زيادة مساحة المناطق الأمامية بطبقة واحدة من البكسل.

دور:
gal_data_t *
gal_binary_open (gal_data_t * input، size_t num، int connectivity، int inplace)

قم بعمل عدد من الفتحات على جيران الإدخال المتصلين (انظر أعلاه للتعرف على الاتصال). لمزيد من المعلومات حول inplace والإخراج ، راجع gal_binary_erode.

الافتتاح هو عملية في علم التشكل الرياضي الذي يعرف بأنه تآكل يتبعه تمدد (انظر أعلاه لتعريفات التعرية والتمدد). سيؤدي الافتتاح بالتالي إلى إزالة الهيكل الخارجي للمقدمة. في هذا التطبيق ، سيتم تطبيق تآكل الأعداد على مجموعة البيانات ، ثم التوسعات.

دور:
size_t
gal_binary_connected_components (gal_data_t * binary، gal_data_t ** out، int connectivity)

قم بإرجاع عدد المكونات المتصلة في ثنائي من خلال خوارزمية البحث الأولى ذات النطاق الواسع (ابحث عن جميع وحدات البكسل التي تنتمي إلى مكون واحد قبل الانتقال إلى التالي). يتم تحديد الاتصال بين وحدتي بكسل بناءً على قيمة الاتصال. out هي مجموعة بيانات بنفس حجم البيانات الثنائية بنوع GAL_TYPE_INT32. سيكون لكل بكسل في الخارج تسمية المكون المتصل الذي ينتمي إليه. يبدأ تصنيف المكونات المتصلة من 1 ، لذلك يتم إعطاء تسمية صفرية لمدخلات & rsquos بكسل الخلفية.

عندما * out! = NULL (تم تخصيص مساحتها بالفعل) ، سيتم مسحها (إلى الصفر) في بداية هذه الوظيفة. خلاف ذلك ، عند * out == NULL ، سيتم تخصيص مجموعة البيانات اللازمة للحفاظ على الإخراج بواسطة هذه الوظيفة.

يجب أن يحتوي الملف الثنائي على نوع GAL_TYPE_UINT8 ، وإلا سيتم إحباط هذه الوظيفة بسبب حدوث خطأ. بخلاف وحدات البكسل الفارغة (بقيمة GAL_BLANK_UINT8 المحددة في قيم المكتبة الفارغة (blank.h)) ، سيتم اعتبار جميع وحدات البكسل الأخرى غير الصفرية في النظام الثنائي مقدمة (وسيتم تصنيفها). ستكون وحدات البكسل الفارغة في الإدخال فارغة أيضًا في الإخراج.

دور:
gal_data_t *
gal_binary_connected_indexs (gal_data_t * اتصال ثنائي ، int)

قم بإنشاء قائمة مرتبطة gal_data_t ، حيث تحتوي كل عقدة في القائمة على مصفوفة بها فهارس المناطق المتصلة. لذلك يمكن أن يكون لمصفوفات كل عقدة حجم مختلف. لاحظ أنه سيتم حساب المؤشرات فقط على وحدات البكسل بقيمة 1 وداخليًا ، سيتم تغيير القيم مؤقتًا إلى 2 (وإعادتها مرة أخرى إلى 1 في النهاية).

دور:
gal_data_t *
gal_binary_connected_adjacency_matrix (gal_data_t * الجوار ، الحجم_ * العدد المتصل)

ابحث عن عدد التسميات المتصلة والتسميات الجديدة بناءً على مصفوفة متجاورة ، والتي يجب أن تكون مصفوفة ثنائية مربعة (اكتب GAL_TYPE_UINT8). مجموعة البيانات التي تم إرجاعها هي قائمة بالتسميات الجديدة لكل تسمية قديمة. بمعنى آخر ، ستعثر هذه الوظيفة على الكائنات المتصلة (ربما من خلال كائن ثالث) وفي مصفوفة الإخراج ، ستحصل العناصر المعنية لجميع تسميات الإدخال على نفس القيمة. يتم وضع العدد الإجمالي للملصقات المتصلة في المساحة التي يشير إليها عدد النقاط.

تحدد مصفوفة التقارب الاتصال بين علامتين. على سبيل المثال ، لنفترض & rsquos أن لدينا 5 تسميات ونعلم أن الملصقات 1 و 5 مرتبطة بالتسمية 3 ، ولكنها غير مرتبطة ببعضها البعض. أيضًا ، لا تلامس الملصقتان 2 و 4 أي ملصق آخر. في المجموع ، لدينا 3 تسميات نهائية: كائن واحد مدمج (مدمج من التسميات 1 و 3 و 5) والتسميات الأولية 2 و 4. ستبدو مصفوفة تجاور الإدخال على هذا النحو (لاحظ الصف والعمود الإضافيين للتسمية 0 الذي تم تجاهله):

على الرغم من أن مصفوفة الجوار كما هي مستخدمة هنا متناظرة ، تفترض هذه الوظيفة حاليًا أنها ممتلئة على جانبي القطر.

دور:
gal_data_t *
gal_binary_connected_adjacency_list (gal_list_sizet_t ** listarr، size_t number، size_t minmapsize، int quietmmap، size_t * numconnected)

ابحث عن عدد التسميات المتصلة والتسميات الجديدة بناءً على قائمة مجاورة. ناتج هذه الوظيفة مطابق لإخراج gal_binary_connected_adjacency_matrix. لكن الاختلاف الرئيسي هو أنه يستخدم قائمة من الملصقات المتصلة بكل تسمية بدلاً من مصفوفة مربعة مجاورة. يتم ذلك لأنه عندما يصبح عدد الملصقات كبيرًا جدًا (على سبيل المثال بمقياس 100000) ، يمكن أن تستهلك المصفوفة المجاورة أكثر من 10 جيجابايت من ذاكرة الوصول العشوائي!

قائمة الإدخال لها التنسيق التالي: إنها مجموعة من المؤشرات لـ gal_list_sizet_t * (أو gal_list_sizet_t **). تحتوي المصفوفة على عناصر رقمية وكل listarr [i] هي قائمة مرتبطة بـ gal_list_sizet_t *. كدليل ، فإن إدخال نفس المثال في gal_binary_connected_adjacency_matrix سيبدو كما هو أدناه وسيكون ناتج هذه الوظيفة مطابقًا له.

من هذا المثال ، من الواضح بالفعل أن هذه الطريقة ستستهلك ذاكرة أقل بكثير. ولكن نظرًا لأنه يحتاج إلى تحليل القوائم (وليس التنقل بسهولة بين عناصر المصفوفة) ، يمكن أن يكون أبطأ. ولكن في السيناريوهات التي يوجد فيها عدد كبير جدًا من الكائنات (التي قد تتجاوز النظام بأكمله و rsquos RAM + SWAP) ، يعد هذا الخيار بديلاً جيدًا ويستحق الانخفاض في سرعة المعالجة إنجاز المهمة.

على غرار gal_binary_connected_adjacency_matrix ، ستكتب هذه الوظيفة العدد النهائي للملصقات المتصلة في numconnected. ولكن نظرًا لأنه لا يأخذ أي وسيطة gal_data_t * (حيث يمكنه أن يرث معلمات minmapsize و quietmmap) ، فإنه يحتاج أيضًا إلى هذه كمدخلات. لمزيد من المعلومات حول minmapsize و quietmmap ، راجع إدارة الذاكرة.

دور:
gal_data_t *
gal_binary_holes_label (gal_data_t * المدخلات ، اتصال int ، size_t * numholes)

قم بتسمية جميع الثقوب الموجودة في المقدمة (العناصر غير الصفرية في الإدخال) كمناطق مستقلة. الثقوب هي مناطق خلفية (ذات قيمة صفرية في الإدخال) محاطة بالكامل بالمقدمة ، كما هو محدد بواسطة الاتصال. تحتوي مجموعة البيانات التي تم إرجاعها على نوع عدد صحيح موقّع 32 بت مع حجم الإدخال. ستحتوي جميع الثقوب الموجودة في الإدخال على ملصقات / عدادات أكبر أو تساوي 1. ستظل بقية مناطق الخلفية ذات قيمة 0 وستكون قيمة وحدات البكسل الأمامية الأولية -1. سيتم كتابة العدد الإجمالي للثقوب حيث يشير عدد الثقوب إلى.

دور:
فارغ
gal_binary_holes_fill (gal_data_t * input ، int connectivity ، size_t maxsize)

املأ جميع الثقوب (0 بكسل مُحاط بـ 1 بكسل ذي قيمة) لمجموعة بيانات الإدخال الثنائي. يمكن ضبط اتصال الثقوب عن طريق الاتصال. لا يتم ملء الثقوب الأكبر من الحجم الأقصى. تعمل هذه الوظيفة حاليًا فقط على مجموعة بيانات ثنائية الأبعاد.


قسم علم الفلك ما بعد الدكتوراه

يبحث قسم علم الفلك في جامعة كاليفورنيا ، بيركلي عن تطبيقات لعالم ما بعد الدكتوراه لقيادة تطوير البنية التحتية للبرامج والخوارزميات العلمية للاستدلال على بيانات السلاسل الزمنية من المسوحات السينوبتيكية الجديدة والحالية. العمل ، الذي تم إجراؤه مع مجموعة متنوعة ومتفاعلة من الأفراد داخل مجموعة البروفيسور جوشوا بلوم ، برعاية منحة برمجية جديدة من مؤسسة جوردون وبيتي مور.

يدور هذا الموقف حول SkyPortal ، وهو مشروع مفتوح المصدر يتمركز في بيركلي ويتيح الإدارة والتحليل التعاوني لمصادر وأحداث المجال الزمني. مع بدء اعتماد المشروع من خلال الاستطلاعات الرائدة ، سيكون الباحث ما بعد الدكتوراه مسؤولاً عن تطوير بوابة SkyPortal لضمان تحقيق إمكاناتها العلمية في جميع أنحاء العالم - سواء من خلال مجموعة بلوم المتعاونة أو غيرهم. سيساعد الباحث في إدارة وتنمية مجتمع المستخدمين مع التركيز على إنشاء مشروع مفتوح المصدر ومستدام طويل الأجل.

بالإضافة إلى تطوير البرمجيات ، فإن أحد المكونات الحاسمة لهذا المنصب هو إنشاء مخرجات علمية علمية أصلية تستخدم بشكل أساسي (و / أو توسع قدرات) SkyPortal. قد يشمل ذلك تطوير الخوارزميات في المجالات المنهجية مثل التعلم شبه الخاضع للإشراف ، واكتشاف الشذوذ غير الخاضع للإشراف ، والذكاء الاصطناعي القابل للتفسير / القابل للتفسير ، والتنبؤ. قد يشمل أيضًا جهودًا خاصة بالمجال في متابعة موجة الجاذبية أو أحداث اضطراب المد والجزر أو النجوم المتغيرة.

قد يعتمد هذا العمل على أحدث الأبحاث في الإحصاء ، والعلوم الحاسوبية ، وعلم الفلك في المجال الزمني ، والتعلم العميق ، ومن المتوقع أن يؤدي إلى تطبيقات تتجاوز علم الفلك. يتمتع التعاون بإمكانية الوصول إلى مجموعات البيانات الفلكية المسجلة الملكية ويقوم ببناء أنظمة قادرة على استيعاب واستيعاب وخلق "معرفة جديدة" من تدفقات البيانات الضخمة المتوقعة من المشاريع القادمة ، مثل تلسكوب المسح الشامل الكبير ومرفق زويكي العابر (ZTF2). يتمتع هذا التعاون أيضًا بإمكانية الوصول إلى مرافق الحوسبة واسعة النطاق في الحرم الجامعي ، في مختبر لورانس بيركلي الوطني (LBNL) ، ومن خلال وقت الحوسبة السحابية الذي تبرع به شركاء الصناعة.

سيدير ​​هذا العمل البروفيسور جوشوا بلوم في قسم علم الفلك ، لكن المنصب يدعو أيضًا إلى تفاعلات قوية مع أعضاء كبار آخرين في التعاون في الأقسام الأخرى (خاصة الدكتور ستيفان فان دير والت ، رئيس المشروع ، والبروفيسور فرناندو بيريز ) وفي معهد بيركلي لعلوم البيانات. كما يتم تشجيع الخبرة والاهتمام الواضح بالعمل مع طلاب الدراسات العليا. سيكون أقوى المرشحين قد أظهروا نجاحًا في إجراء بحث أصلي في علم الفلك والإحصاء والتعلم الآلي (العميق أو غير ذلك) ويجب أن يتمتعوا بسجل حافل في بناء قواعد رموز حوسبة بايثون وصيانتها.

المنصب الذي يبدأ في خريف 2020 هو لمدة عامين ، بدوام كامل ، مع تجديد لمدة عام ثالث حسب توافر الأموال.

الوظيفة ستكون مفتوحة حتى شغلها.

لمزيد من المعلومات حول الوظيفة ، بما في ذلك المؤهلات المطلوبة ومواد التقديم ، انتقل إلى https://aprecruit.berkeley.edu/JPF02472

جامعة كاليفورنيا ، بيركلي هي صاحب عمل AA / EEO. سيحصل جميع المتقدمين المؤهلين على الاعتبار للتوظيف بغض النظر عن العرق أو اللون أو الدين أو الجنس أو التوجه الجنسي أو الهوية الجنسية أو الأصل القومي أو الإعاقة أو السن أو حالة المحاربين القدامى المحمية.


بيانات IceCube ذات المصدر الكامل في السماء: السنوات 2008-2018

قام IceCube بالعديد من عمليات البحث عن مصادر النيوترينوات الشبيهة بالنقاط. تشكل الأحداث الواردة في هذا الإصدار العينة المستخدمة في IceCube & # 8217s لمدة 10 سنوات للبحث عن مصدر نقطة نيوترينو متكامل زمنيًا [1]. الأحداث في العينة هي نيوترينو مرشحة تشبه المسار تم اكتشافها بواسطة IceCube بين أبريل 2008 ويوليو 2008.

تُظهر البيانات الواردة في هذا الإصدار من نموذج مصدر نقطي لـ IceCube دليل 3.3 σ على زيادة تراكمية للأحداث من كتالوج 110 مصادر محتملة ، مدفوعة بشكل أساسي بأربعة مصادر (NGC 1068 ، TXS 0506 + 056 ، PKS 1424 + 240 ، و GB6 J1542 + 6129). يعطي NGC 1068 أكبر فائض ويظهر بالتزامن المكاني مع النقطة الأكثر سخونة في البحث الكامل عن السماء الشمالية [1].

تتضمن عينة حدث مصدر نقطة النيوترينو لمدة 10 سنوات IceCube & # 8217s معالجة محدثة للأحداث بين أبريل 2012 ومايو 2015 ، مما أدى إلى اختلافات في دلالات بعض المصادر ، بما في ذلك TXS 0506 + 056. لمزيد من المعلومات ، يرجى الرجوع إلى [2].

This release contains data beginning in 2008 (IC40) until the spring of 2018 (IC86-VII). In order to standardize the release format of IceCube’s point source candidate events, this release duplicates and supplants previously released data from 2012 and earlier. Events from this release cannot be combined with other IceCube public data releases.


Datasets

Data mining datasets, University of Edinburgh Twenty-four datasets from a wide range of fields including the SuperCOSMOS Sky Survey Object Catalogue and Volcanoes on Venus.

Datasets for textbook Statistics, Data Mining, and Machine Learning in Astronomy (Z. Ivezic, A. Connolly, J. VanderPlas, A. Gray, 2013) Seventeen datasets from the Sloan Digital Sky Survey and other astronomical surveys with Python codes illustrating statistical analysis, classification and graphics.

Datasets for textbook Modern Statistical Methods for Astronomy with R Applications (E. D. Feigelson & G. J. Babu, Cambridge University Press, 2012) Nineteen datasets from several branches of astronomy with R codes illustrating univariate distributions, measurement errors, censoring and truncation, nonlinear regression, multivariate analysis, clustering and classification, spatial point processes, and time series analysis with graphics.

Datasets for R exercises and graphics (University of Birmingham) Several datasets from extragalactic astronomy prepared by Alastair Sanderson for online tutorials on the R statistical software environment with graphics.

Time series of variable stars (University of California Berkeley) Visible band lightcurves of 137 classes of variable stars, serving as training sets for classification of lightcurves generated by wide-field multi-epoch surveys. From Berkeley’s Center for Time Domain Informatics.

Time series of X-ray sources (Naval Research Lab) A variety of Poissonian and Gaussian time series from X-ray astronomy including: quasar, BL Lac object, supernova, accretion binary star systems, gamma-ray burst, and sunspots.


شاهد الفيديو: الجزء الثاني من الدرس الثالث الإعداد الفنى وإدارة مصادر المعلومات مدخل الى علم المكتبات (يونيو 2022).


تعليقات:

  1. Burleigh

    هذه الرسالة القيمة

  2. Meinke

    أنا آسف ، لكنني أعتقد أنك ترتكب خطأ. دعنا نناقش. أرسل لي بريدًا إلكترونيًا إلى PM ، سنتحدث.

  3. Conway

    البديل الآمن :)

  4. Nalmaran

    برافو ، ما هي العبارة الصحيحة ... فكرة رائعة

  5. Sumertun

    آسف ، لا يمكنني مساعدتك. لكنني متأكد من أنك ستجد الحل الصحيح.



اكتب رسالة